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AGTTCTTTTT TACTTTGATA ATTTTATATT CAATTTGTTC ATTAATTAAA GCTTGTGGTA 4500 

TGAAAATAGG AAAGCGATCT ATTTTTACGA CACCATGGCC TTCATGCGTT AAATCAACAA 4560 

CTGTTCCCGT TTTTATGTCA TTTTTAGCTA TTGCTTGCAA AATTTTACCT CCAAAATGAA 4620 

CAGGTTAGGA ACAAAATTAT GCGCTTCCTA ACCTGCCATT ATATATTTCA CTATTTCTGT 4680 

TTATTCTTCG ATTAAATTGT CATCAACATG ATCATTATTT ATTAACTCTT CATTTACAAT 4740 

ATCATTAGGT GCAAAGACAT CTATATGACG TTCTAGATTT AAGAAATTCG CTGGTAATTT 4800 

ACCACCATAT TCTCCATCTA CATTTAGTTG TAAGTCTGTG AATGATGAAA TATTAATTGC 4860 

CTTTGCTTTT TCATAAATAA CTTTAGGATG CTTAGTATGT TCTCCTCTTG AAGCTAAAGT 4 920 

CATAATATGA CCAAGTTCTG CAAGGTTTGA TTTTTCAACT ATAATTAACG TAAAATAGCC 4980 

GTCATCTAAC TTAGCGTCCG GCACTAATTT TTCAAATCCT GCCATTGAAT TTGTTAAACC 5040 

TAAAAAGAAT AATAATGCTT CTCCTTGGAA AACATTACCA TCATATTCAA TTCTTAAATC 5100 

TACAGCTTTC ATTTGAGGTA ACATTTCGAA ACCTTTGaTG TAATAAGCAA ATGGACCAAC 5160 

AATAGATTTC AATTTACTCG GTGTTTCATA AGAGACTTGC GTCAATTGTC CGCCTGCAGC 5220 

25 TAAATTAATA AAGTATCGAT TATTCATTTT ACCAATATCT ACTTTAGTAG AATGACCTTC 5280 

AATGATGACA TCAAGTGCCC CCATGATGTC ATTAGGTATA TGCAATGCAC GTCCAAAGTC 5340 

ATTAACAGTA CCCATAGGAA TGACACCTAG CTTAGGACGA TTAGGCTTTT CTGCGATACC 5400 

30 ATTAACTACT TCATTTAATG TTCCATCACC ACCTGCAGCG ATTAATACAT CATAATTTTC 54 60 

ATGCATAGCT CTTTCTGCTT GAAGTGTGGC ATCACCTATT TTCTCGGTTG CATATGCACT 5520 

CGTTTCATAT CCCGCTTTTT CTAATTTTAT TAAGGCATCA GGTAATTCTC TTTTAAATAG 5580 

CTCTTTACCT GATGTCGGGT TATAAATGAT TCTAGCACGT TTCCTCATAT CTTATCCCTC 5640 

TACTTAAAAT TCATATATTT TAACTTCATC TTTGTTTCGT CTAATAGGGA GTGGGACAGA 5700 

AATAATATTT AACAAAATTT ATTTCGTTCT ACCCCAACTT GCATTGTCTG TAGAATTTCC 5760 

TTTCGAAATT CTCTATGTTG GGGCCCCACC CCAACTTGCA CATTATTGtA AGcTGACAGA 5820 

AAGTCAGCTT CTTTGTTTGG GGGCCCCGCC AACTTGCACA TTATTGTAAG CTGACAGAAA 5880 

ATCAGCTTCT ATGTTGGGGC CCCACTAGAA TTGAAAAAAG CTTGTTACAA GCGTATTTTC 5940 

TTTCAGTCAA CTACAGCCAA TATAACATTG TAGTGCCTAG GACATTGAAT TTATGACCCA 6000 

GGCTCAGTCT TATTTCATCA TTCTTAATAT CGTTAAAGAC CAACTTGTAT CTTAAACAAA 6060 

50 TACTATCTCA ATATGTACAA AGCTTGTTAT TTATTCAGCA TTTTTTGCCG TTCTTCATTA 6120 

TAtAGcTTCG TCAGTTATGC TATTTTACCT TTAAAATGAT GTTGTAAATA TAATGTTGTC 6180 
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AACGCATTAA 


TAAAATTAAT 


ATTTTTACCA 


TTAACATGTA 


CAATGAATAA 


AGTTAAAAGT 


€300 




AATTTGACTT 


CTATAGATAT 


AAATAAACCC 


TCGATTGCAT 


CTAAGTCAGC 


AATCAAGGGT 


6360 


5 


TTATTTTTTA AATCTTCATA 


GTTTGATGAT 


TTAAATTATC 


TTTTATCTAA 


TTCTTGTTTT 


6420 




AATAGTTGAT 


TTACTAATTG 


TGGATTAGCT 


TGACCTTTAG 


ACGCTTTCAT 


AATTTGACCA 


6480 


10 


ACTAAGAAGC 


CCATAGCTTT 


GCCTTTACCA 


TTTTTGTAAT 


CTTCAACTGA 


TTGTTCGTTA 


6540 


TTGTCTAATG 


CTTCATTTAC 


AAATTTTAGA 


AGTGTTGCTT 


CATCAGAAAT 


TTGAACTAAG 


6600 




CCATTATCTT 


CCATAATCTG 


TTTAGCATTA 


CCACCTTTAG 


CTGCTAACTC 


TGGGAAGACT 


6660 


15 


TTCTTCGCAA 


TTTTACTGCT 


CATTGTTCCG 


TCTTCGATAA 


GTTTAATCAT 


ACCTGCTAAA 


6720 




TTTTCTGGTG 


TTAATTTAGT 


ATCTAATAAT 


TCTACTTGAT 


TTTTATTTAA 


ATATTCGTTT 


6780 




ACGCCACCCA 


TTAACCAGTT 


AGATGTTAAT 


TTAACATCTG 


CACCGTGTTC 


AATTGTTGAT 


6840 


20 


TCAAAGAAAT 


CTGACATTTC 


TTTAGTCAAT 


GTTAATACGT 


GTGCATCGTA 


TGCAGGTAAA 


6900 




CCTAATTCAT 


TTACATACTT 


AGCTTTACGT 


TCATCTGGTA 


ATTCAGGAAT 


TGTCTGACGA 


6960 




ACACGCTCTT 


TCCAAGCATC 


ATCAATATAT 


AAAGGTACAA 


TGTCAGGCTC 


TGGGAAGTAA 


7020 


25 


CGGTAATCAT 


CAGAACCTTC 


TTTAACACGC 


ATTAAAATTG 


TTTTACCTGT 


AGATTCATCA 


7080 




AATCGACGTG 


TTTCTTGTCC 


GATTTCTCCA 


CCATTTAACA 


ATTCTTCTTC 


TTGGCGTTTT 


7140 




TCTTCATATT 


CTAAACCTTT 


ACGTACATAG 


TTAAATGAGT 


TTAAGTTTTT 


CAATTCGGCT 


7200 


30 


TTAGTACCAA 


ATTTTTCTTG 


ACCATATGGA 


CGTAAAGAGA 


TGTTAGCATC 


ACAACGTAAA 


7260 




GATCCCTCTT 


CCATCTTAAC 


GTCTGATACA 


CCAGTGTATT 


GAATAATTGA ACGCAATTTT 


7320 


JO 


TCTAAATATG 


CATATGCTTC 


TTTAGGTGAA 


CGAATATCTG 


GTTCAGATAC 


GATTTCAATT 


7380 


AGCGGTGTAC 


CTTGACGGTT 


CAAGTCAACT 


AATGAATACT 


CACCTTTATG 


TGTTGACTTA 


7440 




CCAGCATCTT 


CTTCCATGTG 


AAGAOGAGTA 


ATACCGATTC 


GTTTTGTTTC 


ACCGTCGACT 


7500 


40 


TCGATATCGA 


TATATCCATT 


TTCACCAATT 


GGTTGATCAA 


ATTGAGAAAT 


TTGATATGCT 


7560 




TTTGGATTAT 


CTGGATAGAA 


ATAGTTCTTA 


CGGTCAAACT 


TAGATTCTGT 


TGCGATTTCC 


7620 




ATATTTAGTG 


CCATTGCAGC 


ACGCATTGCC 


CAGTCTACTG 


CACGCTTATT AACAACTGGT 


7680 


45 


AAGACACCTG 


GATATGCTAA 


GTCGATAACA 


TTTGTATTTG 


AGTTAGGTTC 


TGCTCCAAAA 


7740 




TGCGCTGGTG 


ATGGAGAAAA 


CATTTTTGAG 


TCCGTTTTTA 


ACTCTACGTG 


AACTTCAAGT 


. 7800 




CCTATAACTG 


TTTCAAAATG 


CATGATTTCC 


ACTCCTTATA ATTTTTCATA AACGTCATGT 


7860 


50 


AAATTGTATT 


GTGTTTCATA 


TTGATAAGCG 


ACACGATATA ACGTTTTTTC 


ATCGAATGGT 


7920 




TTACCAATGA 


ACTGTAAACC 


GATTGGTCGG 


CCATTTGATT 


GTCCACAAGG 


AACAGAAATA 


7980 
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GGATCATCAA TTTCTTCACC TAAATTAAAC GCaGTgTnAG GCGCTGTTGG ACCAACTACT 8100 

ACATCATAAT TTTCGAATAC TTTATCAAAG TCATTTTTAA TCAATGTTCT AACTTTTTGA 8160 

5 GATTTTTTAT AGTAAGCATC ATAGTAACCT GAACTTAATG CAAATGTACC TAAGAAAATA 8220 

CGACGTTTTA CTTCTTTACC GAAACCTTCA GATCTTGACA TTTTATATAA TTCTTCTAAT 8280 

GAATGAGCTT CTTTAGAATG ATAACCATAA CGAATTCCGT CAAAACGAGA AAGGTTTGAC 8340 

10 

GAAGCTTCTG ATGATGCAAT CACGTAATAT GATGGAATAC CAAATTTAGT ATTTGGCAAT 8400 

GATACTTCCT CAACGACAGC ACCTAAAGAT TTTAAAGTTT CTACAGCGTT TTGAACTGCT 8460 

TCTTTTACGT CATCAGCTAC ACCTTCACCT AAGTATTCTT TAGGTAATGC AACTTTTAAT 8520 

15 

CCTTTAATAT CTTTACCAAT TTCAGATGTA AAGTCTACAT CATCAACTGG TGCACTTGTA 8580 

GAGTCATTAA CATCTGCACC AGAAATAGCT TCTAATACGA TTGCATTATC TTTTACATTT 8640 

20 CGAGTCAATG GACCAATTTG GTCTAATGAA GATGCAAAAG CAACTAATCC AAATCGAGAT 8700 

ACACGACCGT ATGTTGGTTT CATACCGACA ACGCCACAAT ATGCAGCCGG TTGTCTAATT 8760 

GAACCACCTG TGTCTGAACC TAAGCTAAAT GGTACTAAGC CAGCTGCAAc TGCTGCTGCA 8820 

25 GATCCACCTG ATGAACCACC TGGCACTGCT TTATGGTCAA ATGGGTTAAC TGTTTTTTTG 8880 

AAATAAGATG TTTCTGTTGA ACCACCCATT GCAAACTCAT CCATATTTAA TTTACCGATT 894 0 

AAAACGGCAT TTTCATTATG TAGTTTTTCC ATTACAGTAG ATTCGTAAAT TGGCACAAAA 9000 

3Q 

CCTTCTAACA TTTTACTTGC ACATGTTGTT TCTAATCCGT TTGTAATAAT GTTATCTTTT 9060 

ATACCCATTG GAATACCAAA TAATTTGCCA TCCATTTGAT CTTTTGCTTG TAATTCATCC 9120 

AATTCTTGCG CTTTTTTGAT TGCATTTTCT TTATCCAGCG CTAGAAAAGA CTTAATTGTT 9180 

35 

GGATCAGTCT CTTCAATTGC ATCATATATA TCTTTAACAA CATCAGATGG TTTGATTTTT 9240 

TTGTCTTTTA TTAAAGTTAA TAAATTCTCA ACCGATTCGT AGCGAATGCT CATCTTACGC 9300 

GTCCTCCTCA TTCATGATTG TAGGCACTTT AAATTGTCCA TCTTCTGTTT CTTTGGCATT 93 60 

40 

TTTCAAAGCT AATTCTTGTG GAATACCTTT AATTGCTTTA TCTTCACGTA AAACGTTTTG 9420 

TAAATCTAAA ACGTGATATG TAGGTTCAAC GCCTTCTGTA TCAGCGCTAT CATTTTGTTT 9480 

45 TGCAAAATCT AAAATGCTTT CTAATGTGTT GGCCATTTCT TCCGTTTCTT CAGGAGAAAT 9540 

TTGAAGTCTT GCAAGATTCG CGATATGCTC AACTTCTTCA CGTGTTACTT TTGTCATTAA 9600 

TAAAAGCCTC CTTTAAGTCA TTCATCACTA AATTGTATCA AATTTCCAAT TAAAAATCTA 9660 

50 AGTATTTATG AGGTGCTACT TTAATTTCAT ATAAACTGTA TAAACATTAT CATTCGTTTA 9720 

TCAAATCATT TTTTATGAAA ACAACACTCT TTTAATATTA GACAACCCAA TTCAATATTA 9780 
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TATATTGGTA TGCAAGTATT TCAAAAAGAA TAAATTTAAT TTTCCTACTT TTCTAAACAT 9900 
TTATCTTTAT GTATAATGTT TTCAAGTAAC TAAATTATAA ATTAAATAAA GGGAGTGTTT 9960 

ATCATGCTTA CAATGGGGAC AGCATTAAGT CAACAAGTAG ATGCCAATTG GCAAACTTAT 10020 

ATTATGATTG CCGTCTACTT CTTGATACTA ATCGTTATTG GCTTTTACGG TTACAAGCAA 10080 

GCAACTGGTA ACCTAAGCGA GTACATGTTA GGTGGACGTA tATTGGACCG TATATTACTG 10140 

CATTATCAGC TGGAGCTTCA GATATGAGTG GATGGATGAT TATGGGGCTA CCTGGTTCTG 10200 

TCTATAGCAC TGGTCTATCA GCTATGTGGA TTACAATCGG TTTAACATTA GGTGCTTATA 10260 

TAAATTACTT TGTTGTTGCT CCTAGACTTC GTGTTTATAC CGAATTAGCT GGAGATGCAA 10320 

TTACATTACC AGATTTCTTT AAAAATCGTT TAAACGATAA AAATAATGTG TTAAAGATTA 10380 

TTTCTGGATT GATTATCGTA GTATTCTTTA CATTATATAC ACATTCTGGT TTCGTATCTG 10440 

GTGGTAAACT ATTTGAAAGT GCTTTTGGAT TAGATTATCA TTTCGGTTTA ATATTAGTTG 10500 

CTTTCATTGT CATTTTCTAT ACTTTCTTTG GTGGATATTT AGCTGTATCA ATTACAGATT 10560 

TCTTCCAAGG TGTCATTATG TTAATTGCGA TGGTTATGGT CCCTATTGTT GCTATGATGA 10620 

ATTTAAACGG CTGGGGAACG TTTCATGATG TAGCAGCTAT GAAACCTACA AATTTAAATT 10680 

TATTTAAAGG GTTATCATTT ATAGGAATTA TCTCTCTATT TTCATGGGGA TTAGGTTATT 10740 

TCGGTCAACC TCATATCATT GTAAGGTTTA TGTCTATTAA ATCACACAAG ATGCTACCTA 10800 

AAGCTAGACG TTTAGGTATT AGCTGGATGG CTGTTGGTTT ATTAGGCGCT GTGGCTGTTG 10860 

GTTTAACAGG TATTGCATTC GTACCTGCTT ATCATATTAA ACTAGAAGAT CCTGAGACAT 10920 

TATTCATCGT GATGAGTCAA GTACTCTTCC ATCCTCTTGT AGGTGGTTTC TTACTTGCTG 10980 

CGATTCTAGC TGCAATTATG AGCACGATTT CTTCACAATT ACTTGTAACA TCTAGTTCAC 11040 

TAACGGAAGA CTTTTATAAA TTAATTCGTG GTGAAGAAAA AGCTAAAACG CACCAAAAAG 11100 

AATTTGTTAT GATTGGAAGA TTATCTGTAT TAGTTGTAGC AATTGTTGCC ATCGCGATTG 11160 

CATGGAATCC AAACGACACA ATTCTAAACT TAGTAGGTAA CGCTTGGGCC GGATTTGGTG 11220 

CATCGTTCAG TCCACTTGTG CTATTTGCAC TTTACTGGAA AGGTTTGACA CGTGCCGGTG 11280 

CTGTAAGTGG AATGGTTTCA GGTGCCTTAG TCGTTATCGT TTGGATTGCA TGGATTAAAC 11340 

CATTGGCACA TATCAACGAA ATATTCGGCT TATATGAAAT TATTCCTGGA TTTATTGTAA 114 00 

GTGTAATCGT TACATATGTT GTAAGTAAAC TTACTAAAAA ACCTGGTGCA TTTGTTGAAA 11460 

CTGACTTAAA CAAAGTTCGT GACATCGTTA GAGAAAAATA ATTCATAAGT CTTAACAAAT 11520 

TAAAAAGGTA CTAATGTTAA TCAAAATTAT GACTAACATT GGTACCTTTT TATTATCTTT 11580 
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AATTAAAGCA 


CGTGGTTGGT 


TACCATCTTT 


AATACGAATT 


TCATAGTTAT 


CGATTTTATC 


11700 




GAAATATTTA 


TTCGCTTGTT 


CAGTAACGTA 


CTGTGTAATA 


CCAATTGTTT 


CAGCTTGTCC 


11760 


5 


ATAGTAATCG 


ATTGGTAAAT 


CTACTACTAA 


TCGTTGTGGC 


TTTTTATCAA 


CAAATTTAAC 


11820 




TTTCCCTACT GCTTGTGTGA AATTAGAAAA ATATGATTGC AAATTATCAT 


TAAATTGCTT 


11880 


10 


GAAATTATTA 


TTTAAATTTT 


CATCATAATC 


TGCTGCTGTT 


GAAGAAGGTA 


ATAAAGCTGA 


11940 


TTTTTCATTG 


ATATTATGCC 


ATTCATTAAG 


CTTTGTTTGA 


CTCTTTTCTG 


CAGTCGCTTG 


12000 




AGTGATAAAT 


TCACCTGGTG 


TGATTGAATC 


TTCACTTGAT 


TGCTTATAAA 


TTGCAAAATG 


12060 


15 


AATTGGTATA 


TCTTTTAAAT 


CATCATTTTC 


ACGTAACCTT 


GATAATATCT 


CACTAGCCAT 


12120 




TTGTTTACCT 


TGCTTTTTAA 


CTcGCTATCA 


TCTAGTTTTT 


TACTAAAAGT 


CGATCCATCT 


12180 




TTTTCTTTTT TATAGTAATA AACACTATTC ATAGCTAAAC 




ACCTTTAATA 


12240 


20 


TTCTTACCTT 


TTGTATCTCC 


ACCACCATAA 


AAATCTTGCT 


CTAAAATGTT 


AGATAAATAG 


12300 




GCTGGTGATT 


TTTCTGCAAT 


CTTTTCAGGA 


TCTGTTTCAC 


CTt CGTGTGA 


TGGATTAAGT 


12360 




CCTAAATTTT 


CATTCGCTTT 


CTTGTCTTTT 


ttatcttttt 


CAGACATTTT 


ATCGATTTCA 


12420 


25 


CGTTTTGTAT 


ACTTAGGATT 


TAAATAGGCA 


TTAATTGTTT 


TCTTGTCCAA 


AAATTGACCA 


12480 




TCTTGATACA 


AATATTT ATC 


TGTTGGAAAT 


ACTTCTTTAC 


TTAAGTTCAA 


TAAACCATCT 


12540 




TCAAAGTCGC 


CGCCATTATA 


ACTATTTGCC 


ATGTTATCTT 


GTAAAAGTCC 


TCTTGCCTGG 


12600 


30 


CTTTCTTTAA 


ATGGTAACAA 


TGTACGATAG 


TTATCACCTT 


GTACATTTTT 


ATCCGTTGCA 


12660 




ATTTCTTTTA 


CTTGATTTGA 


ACTATTGTTA 


TGTTTTTGAT 


TATCTTTTCC 


AGCCTGGTCA 


12720. 


35 


TCCTTATGGT 


TACCACAAGC 


AGCGAGTATA AAGATAGCTG 


TAATCAATAA 


TACTAATGTA 


12780 


CGCTTCATCG 


ACATACCCCT 


CTAACTATTT 


AATTCATTTT 


GCTTATCTAC 


AAATTGTTGC 


12640 




TCTGTCCAAA 


TTTCAATACC 


TAAACTTTGT 


GCTTTTGTTA ATTTTGAACC 


TGCATCTTCA 


12900 


40 • 


CCAGCAATAA 


CGACATCTGT 


ATTTTTAGTA 


ACGCTACTTG 


TAACTTTAGC 


ACCTTGTGAT 


12960 


GCAAGCCATT 


TAGATGCTTC 


ATTGCGTGTC 


ATTTGATGTA 


GCTTACCAGT 


CAGTACTATC 


13020 




GTTTTACCAC 


TAAATTCAGG 


ATGTCCTTCA 


ATATCTGATG 


TTTTGATACC 


TTTATAAATC 


13080 


45 


ATATTAACAT 


GTTTATCTTT 


TAATTTTTGA 


ATTAAAGCAC 


GAATATCTTC 


ATTTTCTAAA 


13140 




TAAGTAACTA 


CAGATTGTGC 


TACTTTATCA 


CCTATATCAT 


GAATTTCTAC 


TAATTCCGCT 


13200 




TCAGTTACCG 


TTAGTAATCG 


ATCTATCGTT 


TCATATTTTT 


CTGCTAACAC 


TTGGCTCGCT 


13260 


50 


TTAACACCTA AATGCCTAAT ACCTAGACCA AATAATAAAT TTTCTAAAGA GTTGTCCTTA 


13320 




GCTTGTTGAA 


TGGCAGCTAA 


TAAATTATCA 


ACTTTTTTCT 


GCCCCATTCT 


GTCTAAAGGT 


13380 



55 



783 



EP 0 786 519 A2 



10 



TAAAGCTGTT GAATAATTTT AGTGCCTAAA CCATCAATAT TcATGGCTTG TCTTGaTACA 
AAGTGnATCa ATCCtTcAAC AAGTTGTGCT TGGTCATTTT GG 
(2) INFORMATION FOR SEQ ID NO: 155: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 1B93 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY : linear 



13500 
13542 



15 



20 



25 



30 



35 



40 



45 



50 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 155: 

CAGTAAACAC CTCTGATTAC GAATATTTAT ACATTTATTT TAACACATGC ACTGATTTAC 60 

GACTACTAAA CACCTTTACG TAAAAAGGGT AAACATGGTT TATCTATCTT GGTTATCTAT 120 

TTATAAATAT TTnTCATATT ACGCATAACA ATTGCTTAAA ATATGTATAA AAATGAATAT 180 

ATGTGTAATA AACTTGCTAA TTATTAGATT TAATAAGCGT CAATTGTTTG AACATATTtA 240 

ATTAAAATCA CATTGATATC ACAGATACGA ATATTGTCGT ATAGAAATTG AAAATTCTAT 3 00 

TTTTTAAATG AAAGTCTTCA ACATAATTTT AAGTTTCAAC ATGAGAAAAA TCGATTAACA 360 

AACAACGTCA GTTGAATATG CCTTTTGAGA CATTTCAAAC TTTACAATTG TTGCTAATCG 42 0 

ATATATTTGC TTTTAGTGAT CCCTGCTATA AAATAAATCA ACGATTTCTA ATAAGTGTTT 4 B0 

TGTATTGAAT TGTTCATCAA TTTGCGTTAG TTCATCCACT GCTGCGTCTC TATGATAAGT 54 0 

CAATTTATCT TCTGCGCCAT CTTTCCCTAA TAAACTCACG TACGTACTTT TATTATTTTC 600 

AAGATCGCTG CCCACTTTTT TACCTAACTT TGCTTCATCA CCATAGCAGT CTAATAAATC 660 

ATCTTTAATC TGGAACATCA TACCTAAATG ATAACTATAA CTTTCTAAAT GTTCTTTAGT 720 

TGTSTCATCG ACATTAGCGA TATCTGCTGC ACTCATAACC GCAAAAGTTA ATAATGCTCC 780 

TGTTTTTGTT TTGTGTATCA TTTCCAAAGT TTCAAGATCA ATTGGTTGGC CTTCGCTTTG 840 

CATATCTAAC ATTTGACCGC CGACCATTCC AACATGACCA CTTGCTATTG ACAGCCGTTG 900 

TAGAACTTTT ATTTTTACTT CATCAGTTAA TCTATCATCA CTTGAAATAA GTTCAAATGC 960 
TTTAGTTAAT AAAGCATCAC CTGCTAATAT CGCAGTCCAC TCACCATATA CTTTATGATT ■ 1020 

TGTTAATTTT CCTCGTCGAT AATCATCATT ATCCATCGCT GGTAGGTCAT CATGAATAAG 1080 

TGAATATGTA TGAATCATTT CTAGTGCAAT TGCGCTCTTC ATACCTAACT CATACTCGGT 1140 

ATTTAGTGAA TCTAAAGTGA GTAATAACAG AACTGGTCGG ATGCGTTTAC CTCCAGCATT 1200 

TAATGAATAC AACATACTTT CTTCTAGCTG AGTATCCATT ACTGATTTAT TTATCGCAAC 1260 
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CATCCTCAGC TTCTTCTTTT ATTAAGTCAT TCACCTTTTT TTCGGCATTT TTTAAAGTTG 1380 

TGTCACAAGC TGCTGATAGT TTCATACCAC GTTGATATAA ATCTAATGAT TCCTCTAAAG 1440 

ATACTGTTTC ATTATCTAAT TTTTGAACAA TTTGCTCTAA TTCTTGCATC ATTTCTTCAA 1500 

AACTTTGCGT TTCTTTAGTC ATTATTACAC CTTACTTTCG TAACTTTTGC ATCTACTAAG 1560 

CCATCTTTCA TTGTTAACGT CAATTGATCA TTTTCTGTTA AATCTTTAGT ACTCGTAATG 1620 

ACTTCGTCTT TTTTATTAAC AATTGCATAT CCACGCAACA TTGTATTAGT TGGACTTAAA 1680 

TTGTTTAAGT TTTCTACTTT ATTTTTCAAA TCATTTTTAT AACTTAATAT CTTAGAATTC 1740 

AATAATTTAA CAAGTTGGTT TGTCAATTGA AGATTATnTT GTTGTTCTTG ATTAACACTA 1800 

CTTAGTAATG CTTTTAAATn ATAACGTTGG TGCAACAGCA TTAAATCGAG GCCCCGGTGG 1860 

TCCAAAGTTG CCCGAATTnG TGGTTTCAGG CCC 1893 
(2) INFORMATION FOR SEQ ID NO: 156: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 821 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
25 {D) TOPOLOGY: linear 



{Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 156: 

AAAATATATT CCTTCACTTA ATATTCAATT AGAGAAAAAC ATGGTGATTG TAATATGTTG 60 

TGCAATATTT CTGGGTGTTT TAATACTTTT TTTATTTCTG AATCGTAAGC TAAGGTTGGA 120 

AATTTATAAT AATAACTCTA GTAAAGGGAA AATAATTTTA TTTCCTTCAT TAAAAAACTT 180 

TTGTTTCACA ATATTTTATT ATTTTTTATT TGGCGGTCTT TCAATAATGG CTCTAAGTAT 24 0 

GTTATTAACT TTAAATCCTC AAAATATAAT AGGCTTTATT GGTTGGTTGG TAATGACTGC 3 00 

AGGTTTCTTT CTGTTAAACA TGTCATCGAT TATTGACAAA AAAATTTATG TATTATCTAA 360 

AACTAACACG GTGGAAAAAT GATGGTTTAG CTGGATTTAC TGCAGGTTCT ATTTCGGCAA 420 

TACTTGTATA TTGGACCAAT CAAAAAAATG AATTTGGAAT AAAAGATAAA AACGATTGGA 4 80 

TAGGACATAA ACTAGACGTT GGTATAGATG CTGTAGAAAA ATCTGCAGAA AAAACAGTAG 540 

ATGGTGTTGA AAATGTCATG GTGAAGCTTC AAAAAGTATT TCTAATCATA TAAGCCCTAA 600 

GAAATGGAGC TGGTAAATGT TGCTATGCGA ATCTAAAATC ATCAATAAAA ACCCAAAATA 660 

50 TAGAATTATT AAATATAATG ATGAATACTT AATGGTCGAT ATAATAAGCA CTTGGATTAG 720 

TTTATTTTTT CCTTTTATTA ATTGGTTCAT CCCaAAAGaA TACGTCAAAA TTAGTAGAGA 780 
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(2) INFORMATION FOR SEQ ID NO: 157: 

(i) SEQUENCE CHARACTERISTICS: 
5 (A) LENGTH: 2343 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

10 

<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 157: 
AGTAAGATAA TTTTCAATTA GAAAATATCT TACTGCTGTT CTCTATTTAT ACAATACTTC 60 

15 GTATTGAATG GcTTCGCTTT CCTAGGGTGC CGTCTCAGCC TTGGTCTTCG ACTGGCACTG 120 

CTCCCTCAGG AGTCTCGCCA TTAATACTAC GTATTAACAT GTAATTTTAC TTTGAAATAC 180 
TTTTAAAAAA TAAGACACTT TGCCCAACTT GCACATAAAT GTAAAATTCA ATAAAATGAA 240 

20 TTTTCTGTGT TGGGTCCCTT CTTATAATTT AATAAATACC ACTAAACTAA ATTAACGAGG 300 

TGCCTTATGT ATAAAAATTA TAACATGCCC CAACTACACT ACCAATAGAA ACTTCTGTTA 360 
GAATCCCTCA AAATGATATT TCACGATATG TTAATGAAAT TGTTGAAACr ATACCTGATA 420 

25 GCGAATTCGA TGAATTCAGA CATCATCGTG GCGCAACATC CTATCATCCA AAAATGATGT 480 

TAAAAATCAT CTTATATGCA TATACTCAAT CTGTTTAATT ATGTTCAAAG CATTAAGGTA 540 

ACAAGACAAT ATCTAAGATA TCAAAGATAG AAATTTTTTG ACGTTGTTGC TGATTGTAAA 600 

30 i 

CATAACCATC AATTTCATAA TTAATAGCAT CAATACGATA AATGGTTAAG CGTACTGAAT 660 

CTACAAAGCC ATTATTATAA AATTTAACTT CTACAGGTTG GGCATATTGT AGCGCCTCGT 720 

GTAGCCGAAT GTTTAGCTCA GCCAATTGAT CATCTGATAA TACAGGACGT GTAATTTTGT 780 

35 

TTTGGTCGAT AATGTATTGT TGAATCGTTT CGAATTGTTC GGGTAATGTT GCAAAAGGAG 840 

CCCSTTTAAT CATGCCTCTT CCCATAGGTA TATTGTTATC TAGTAATTCT CTTGGAACGT 900 

TACGATAATC AGTTTCTTCT TCATAACTTG TCATCCTTAA TTCACCCCAA TCTGATAATT 960 

40 

ACATTATACG AACATGTGTT CTATTTTGCA ACAAAAATTT TGTGGaAGCA TAAACGCGTT 1020 

AATAATTAAT GCTCGTGtAA GTAAAAAAGA GGGATTAATT AAAATCGAAT AATGaCATAT 1080 

45 CACaGCAAAT AGTTCTTTTA AAGTAGTTAA ATAGTTTTAG CTTTAAGGAA aTGATAAaTG 1140 

ATTGTwAATT CTAGCTAAAA TTTAATAAAA TGAAAATAAG ACTAACATGG AGGGGTAAAA 1200 

GTAATGACAA ATGGATATAT TGGTTCTTAC ACTAAAAAGA ATGGTAAAGG GATTTATCGT 1260 

50 TTTGAATTAA ACGAAAATCA GTCACGTATT GATTTATTAG AAACAGGATT TGAATTAGAA 1320 

GCGTCTACAT ATTTGGTGCG TAATAATGAA GTTTTATATG GAATCAACAA AGAAGGAGAA 1380 
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30 



35 



TGTTTGTCTT CAAAAGCTGG TACAGGTTGT TATGTATCGA TTTCAGAAGA TAAACGATAT 1500 

TTATTTGAAG CGGTATATGG TGCTGGCATC ATACGTATGT ATGAATTAAA TACGCACACA 1560 

GGTGAAATTA TACGTCTAAT TCAAGAACTT GCACATGATT TTCCAACAGG TACACATGAA 1620 

AGACAAGATC ATCCACACGC ACATTATATT AATCAAACTC CAGATGGTAA GTACGTTGCA 1660 

GTAACAGATT TAGGTGCTGA TCGTATCGTT ACTTATAAAT TTGATGACAA CGGGTTTGAA 1740 

TTTTATAAAG AATCTTTATT TAAAGATAGT GATGGGACAA GACATATTGA ATTTCATGAT 1800 

AATGGAAAAT TTGCTTATGT CGTACACGAA TTATCAAATA CTGTGAGTGT TGCAGAATAT 1860 

AATGACGGTA AATTTGAAGA GCTCGAGCGT CATTTAACAA TTCCTGAAAA CTTTGATGGA 1920 

GATACTAAAC TTGcAGCAGT GCGTTTATCT CATGaTCAAC AATTCTTATA TGTATCTAAT 1980 

AGAGGGCATG ATAGCATTGC AATTTTTAAA GTTCTTGATA ATGGTCAACA CTTAGAACTA 2040 

GTAACAaTTA CTGAAaGTGG TGGTCAATTC CCAAGAGATT TTAATATTGC CTCATCAGAT 2100 

GACCyTTTAG TTTgTGCTCA kGaGCaAGGA GATTCAGTTG TAACTGTTTT CGAAAGAAAT 2160 

AAAGAAACAG GTAAAATTAC GCTATGTGAT AACACTCGTG TAGCATCTGA AGGTGTATGT 2220 

GTCATATTTT AATCTTTAAT TAATCATGAT AAAAAGAAAA CCATGTTTCC AAAAAATTTG 22 BO 

TGTATACCTT GAAATTTATT GnTTTCCAGn ACATCAATTA TGGGAAGCAT GGnTTATTTT 2340 

TGT 2343 
(2) INFORMATION FOR SEQ ID NO: 158: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4 837 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



40 



45 



SO 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 158: 

AAATTGCCAG TTGGTATCGC TTCTGGTGCA GTAGTCGAAG GTTTCTTCCA AGGTATCATT . 60 

CCGATTGGCT ATATCGTTAT GATGGCAGTA TTGTTATACA AAATTACTGT TGAATCTGGA 120 

CAATTTTTAA CAATTCAAGA TAGTATTACA AATATTTCAC AAGACCAACG TATTCAAGTT 180 

TTACTTATTG GATTTGCATT CAACGCATTT TTAGAAGGTG CAGCAGGATT* TGGTGTACCA 240 

ATTGCAATTT GTGCACTTTT ATTAACACAA TTAGGATTTA ATCCATTAAA AGCTGCGATG 300 

TTATGTTTAG TCGCAAATGC AGCGTCTGGT GCTTTTGGTG CGATTGGTAT CCCTGTAGGT 360 

GTTGTAGAAA CGTTGAAATT ACCTGGAGAT GTTTCAGTAT TAGGTGTTTC TCAATCAGCA 420 
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GGTTTTAGAG 


GTGTTAAAGA AACATTACCA GCAATTTTAG TAGTTTCAAT CACTTATACA 


54 0 




CTTACTCAAG 


GATTATTAAC 


TGTATTCAGT 


GGACCTGAAT 


TAGCAGATAT 


TATTCCACCG 


600 


5 


TTATTAACAA 


TGTTAGCATT 


AGCAGTATTT 


TCTAAAAAAT 


TCCAACCAAA 


ACACATTTAT 


660 




CGTGTTAATA AAGATGAAGA AATTGAACCT 


GCAAAAGCAC 


ATTCTGCAAA 


AGCAGTATTA 


720 


10 


CATGCATGGA 


GCCCATTCAT 


TGTATTAACA 


GTCATTGTAA 


TGATTTGGAG 


TGCGCCATTC 


780 


TTTAAAAACT 


TATTCTTACC 


AAATGGTGCT 


TTATCATCAT 


TAGTATTTAA 


ATTCAACTTA 


840 




CCTGGaACAA 


TCAGCGAAGT 


TACGCATAAA 


CCATTAGTAT 


TGACTTTAAA 


TATTATTGGA 


900 


15 


CAAACAGGTA 


CAGCTATTTT 


ATTAACTATT 


ATTATTACAA 


TTTTAATGTC 


TAAAAAGGTT 


960 




AACTTTAAAG 


ATGCAGGTAG 


ATTATTCGGC 


GTTACATTTA 


AAGAGTTGTG 


GTTACCAGTT 


1020 




CTTACAATTT GTTTCATCTT AGCAATTTCT AAAATCACAA CTTATGGTGG 


TTTAAGTGCA 


1080 


20 


GCAATGGGTC 


AAGGTATTGC 


TAAAGCAGGT AATGTCTTCC 


CAGTTCTATC ACCAATTTTA 


1140 




GGTTGGATAG 


GTGTGTTTAT 


GACAGGATCA 


GTTGTAAATA 




r\X 1 luLilLLii 


1200 




ATTCAAGCTT 


CTGTTGCACA 


ACAAATTGGA 


ACAAGTGGTT 


CACTTCTTGT 


aI V.1UV. 1M1 


1260 


25 


ACAGTTGGTG GTGTAGCGGC 


AAAATTGATT 


TCACCACAAT 


CAATTGCAAT 


TGCAACTGCA 


1320 




GCAGTAAAAC 


AAGTTGGTAA 


GGAATCAGAA 


TTATTAAAAA 


TGACATTGAA 


ATACAGTGTA 


1380 




TGTTTACTAA 


TATTCATCTG 


TATTTGGACT 


TTCATCTTGT 


CATTATTATA 


AAAAAACGTA 


1440 


30 


TTTCAAAATA 


TAAATATACA 


GAAGGTGAGA 


TGTTTTCTAA 


CATCTCATCT 


TTTTTTTATG 


1500 




GATCATTAAT 


GAAAGAAGTT 


TGACATTATA 


ATAATGGTAG 


CGCTTTATGT 


TAAAATGAAT 


1560 


35 


AGTGAGTAAT 


CAGCAATCAA 


ATTAAATTGG 


TTGATAGCTG 


TTAAGGTTTG 


TGGTTTTGTC 


1620 


TTTGTGCTAT 


CGCnCATAAA 


GTATATAATT 


AAAGTAGTTT 


CGTTATTATA 


AAATATTAAT 


1680 




ATACATAGTA 


GATAGTAATA 


GAGCATCACC 


ATGGGAACCT 


ATTGAGACAC 


TTATTGATTT 


1740 


40 


AAAGTGGTAT 


TAATATGTCG 


TATTTCTCGA 


ACGTTCCATT 


ATTCATTTTA 


AAAAGGGGGA 


1600 


CTGTATTTGT 


TATGACAACA 


CAACATAGCA 


AAACAGATGT 


CATCTTAATT 


GGTGGCGGTA 


I860 




TTATGAGTGC 


aCATTAGGAA 


CATTACTTAA AGAATTATCA 


CCTGAGAAAA 


ATATTAAAGT 


1920 


45 


GTTTGAAAAA 


TTAGCACAAC 


CTGGCGAAGA 


GAGTTCAAAT 


GTATGGAATA 


ATGCCGGTAC 


1980 




AGGGCATTCA 


GCACTTTGCG 


AGTTGAACTA 


TACAAAAGAA 


GGTAAGGATG 


GCACAGTTGA 


2040 




TTGTAGTAAA 


GCAATTAAGA 


TAAATGAGCA 


GTACCAAATT 


TCAAAACAGT 


TTTGGGCATA 


2100 


SO 


TTTAGTTAAA ACAGGACAAT 


TAGATAACCC AGATCGCTTT ATTCAAGCGG 


TGCCACACAT 


2160 




GAGTTTTGTC 


ATTGGCGAAG 


ATAATGTAGC 


TTTTATAAAA 


AGTCGTGTTG 


CAACGTTAAA 


2220 
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GGTACCGTTA ATGATTGAAG 


GTCGTAAGTC 


TGATGAACCA ATTGCTTTAA 


CTTATGATGA 


2340 




AACTGGTACa gATGTTAACT TTGGTGCGTT AACTGCAAAG TTATTTGATA ATTTAGAGCA 


2400 


5 


ACGTGGTGTG GGAATTCAAT 


ATAAGCAGAA TGTATTAGAC ATCAAGAAAC AGAAATCTGG 


2460 




GGTATGGCTA GTTAAAGTTA AAGATTTAGA AACTAATGAA ACGACAACAT ATGAATCTGA 


2520 


10 


TTTTGTATTT ATTGGTGCTG 


GCGGTGCGAG 


TTTACCATTA 


CTCCAAAAGA 


CTGGGATTAA 


2580 


ACAATCAAAA CATATTGGTG 


GTTTCCCGGT AAGTGGATTA TTCCTGCGCT 


GTACAAATCA 


2640 




AGAAGTGATT GATCGTCATC 


ATGCTAAAGT 


GTACGGAAAA 


GCAGCAGTGG 


GTGCGCCACC 


2700 


15 


AATGTCAGTG CCGCACTTAG 


ATACACGTTT 


TGTAGACGGC AAGCGTTCAT 


TGTTATTTGG 


2760 


TCCATTTGCA GGTTTCTCAC 


CTAAATTTTT 


AAAAACAGGT 


TCACATATGG 


ATTTAATTAA 


2820 




ATCGGTTAAA CCAAATAATA 


TCGTGACGAT 


GTTATCTGCA 


GGTATCAAAG 


AAATGAGTCT 


2880 


20 


TACGAAGTAT TTAGTGTCAC 


AATTGATGTT 


ATCTAATGAT 


GAGCGTATGG 


ATGATTTAAG 


2940 




AGTCTTTTTC CCAAATGCTA AAAATGAAGA TTGGGAAGTG 


ATTACAGCAG 


GGCAACGTGT 


3000 




CCAAGTAATC AAGGATACTG 


AGGATTCTAA AGGTAACTTA 


CAATTTGGTA 


CTGAAGTTAT 


3060 


25 


TACGTCAGAT GATGGCACAT 


TAGCTGCATT 


ACTTGGTGCA 


TCACCTGGTG 


CGTCAACAGC 


3120 




TGTAGATATT ATGTTTGATG 


TTTTACAGAG 


ATGCTATCGT 


GATGAATTCA 


AAGGATGGGA 


3180 




ACCAAAGATT AAAGAAATGG 


TGCCGTCATT 


TGGTTATCGC 


tTAACAGATC 


ATGAGGATTT 


3240 


30 


ATATCATAAA ATTAATGAAG 


AAGTAACTAA 


GTATTTACAA 


GTTAAATAAT 


AAACGAAACG 


3300 




GTAATGTCTT TTTTAATGTG 


ATAGACATTA 


CCGTTTTTTA 


GTGGTTAATA 


AAAATCATTT 


3360 




TAATTGTTTC AGTTGCTTGT 


TAATAGTGTC 


TACGTAGTTC 


TTGTTTTTAA AGAATTGAAT 


3420 


35 


TATCCAAATT AATACATAAA 


CCACAATGAA 


GATAATTGTG 


AATATGATTA 


GATAATGCAC 


3480 




TGTTAGTGGA AACCAACCGG 


CAAGCATTGC 


TAAAGGCAAG 


AATCCGACAT 


ACGTTGTTAT 


3540 


40 


GAAATGCATT ATAGTTGCTT 


TAGTAATGCT 


CCAATCTGTG 


TATTTAAAGA 


TAAAATCTCC 


3600 


AAGGAAAAAG ACGACGCCTA 


TGAGTAACCA 


TAAAATGATA 


GAAATCAACA 


TTACGGTAGT 


3660 




TTCTGTGAAA TGCGTATAAT 


ACAATATGCC 


AATAGTTGAT 


TGTGGGTTCA 


GTGGATAATA 


3720 


45 


TTTGCCGTCT GCAAATAACA 


TACTAAAGAA 


CAGTGAAAGG 


GACAAACCAA 


TGATTAAGCT 


3780 




AATAAATAAT GAGTTTTTCA 


AATTTTTCAT 


ATTGATAAGC 


GCTCCTTTAT 


AGATTTTAAA 


3840 




TAACGTCTAG AAGAATAGGT 


GTAGTGTGCA 


TCTTTAAGAT 


ACATACGTAT 


AAGTCCATTT 


3900 


50 


GGCTCTAATA ATAATTTTTC 


AATGTAATAC 


TTGTTGACGA 


TTTCTGATTT 


GGAAATGCGA 


3960 




ATGAAATGTT GTGGTAACTG 


TTTTTCTAGT 


TCATAAAGTC 


GTAATTTTAG 


TTTGAATTTT 


4020 



55 



789 



EP0 786 519 A2 



5 



10 



15 



20 



ACATTAATGA 


TATGGATTTC 


TTTGTCTATG 


TATCCGACTA 


ATGTATGTGA 


TTTGTCTAAA 


4140 


TCATTGACTG 


CATTAATAAT 


ACTTTGAACG 


TTATCATTCA 


TTTTAGGTGC 


ATGTATATCA 


4200 


ATATAAGATT 


CCGTCTCATT 


TGCATTGATA 


AATAAATTGA 


GTTTCATCAT AGGTTAATGC 


4260 


CTCCTTCAAA 


ATTATTAAAC 


CATAAATGAC 


CATCGATATA 


TTTAAATTTT 


GTTGAATGGT 


4320 


AGAAATTAAA 


TGTTAAGTGG 


CTAGAAAGCG 


CTAATCAATA 


TAAAAGATAC 


CTCCTGAAAT 


4380 


AAAAACAGAA 


ATGTTTTTTC 


AGGAGGTAGA 


GATTAAAGTG 


AATTATTTGG 


CAGTGTAATA 


4440 


GTAAAGGTGG 


TTACATACTC 


GTTACTTTGT 


GTGAATTGGA TTGTACCATG ATGCAATTCA 


4500 


ATGATGGATT 


TTGTAATTGC 


AAGACCTAAA 


CCATTGCTAT 


TATCATGTTT 


GCTCACTTTA 


4560 


TAAAAACGTT 


CAAATAAACG 


TGCTTCAGCT 


TGTGGACTAA TTGGTGAACC ATCATTACTT 


4620 


ATTGTGAAAA 


TGATATTGTT 


GTGACTATGT 


TGCAAAGCGA 


TGTCAATGGC 


ACCACCAACA 


4680 


TCTGTATACT 


TAATAGCATT 


TATTAATAAA 


TTACTCAATG 


CTTGATGTAA 


CAAACGTTGA 


4740 


TTTCCTAGGA 


AATTGATGAT 


TCTAGGTCAG 


CTAAnATGAT 


TAACGACTTT 


TCATCAGCAG 


4800 


CAnATTGTTC 


ATGTCGAATG 


ATATCnTTAA 


TGAGCTG 






4837 



25 (2) INFORMATION FOR SEQ ID NO: 159: 

(i) SEQUENCE CHARACTERISTICS : 

'(A) LENGTH: 1600 base pairs 
(B) TYPE: nucleic acid 
30 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 159: 

35 

ACAATTATTG GATTATTATC AAGCAACGTT AATGGATGAC TTCCACTTAC AACAGAAATG 60 

CCCATAGATT CTAAATCTtT TGCATGAGCA TCTTGTGATA AGTCTTTTCC ATCATTGACA 120 

GTTACATTCG CACCTAATTT ACTTAATAAT TTAGCTGCTT CATAACCACT TTTTGCCAAA 180 

40 

CCGACAACTA ATACATTTTT ATTTTCTAAC CCTGTATAAT TAAGCATCTT AATGCACTCC 24 0 

AATCCATAAA CCGATTAAAC CTGAAATCAG ACCAACAGCC CAAAATACTG TAACTACTTT 300 

45 CCATTCGCTC CATCCTATCA ATTCAAAATG ATGATGAATC GGACTCATTT TAAATATACG 360 

CTTTCCAGTC AATTTAAAGC TAGCGACTTG TAACATAACA GATAATGTTT CAATTACGAA 420 

TACTAAACCT ATAAAAATTA ATGATAATTC CTGATTAAGC ATGATTGAAA TGGTAGCAAA 4 80 

50 TATACCACCT AAAGCTAAGC TACCTGTATC TCCCATAAAC ACTTTAGCAG GGTTAATGTT 54 0 

ATATGGTAAA AATCCTAAAA GTGCAAACAA CATAATGATA CAGAAAATAC CAATTGCCGT 600 
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TGCTAATCCA TCTAAACCAT CTGTTAAATT TACTGCATTA GAAAAACCTA CTTGCCAAAA 
AACAATGAAA ATAACATATG CAAATGATAG TGGGATTGCT ACATTCGTAA ATGGAATATG 
TATGCTCGTA GAAAAATTCA CCAAATGAAA CACATTACTT AAAACAAAGA ATATAATCGC 
AATACCAATT TGCGCCAAAA ACTTCTGTTT ACTTGTTAAA CCTTGGTTAT TCTTTTTAAC 
AACAATAATA TAATCATCTA TAAAACCAAT TAACCCAAAA CCAATCGTCA CAAATAATAA 
CAGTATGATT GGATTAGCTT GATCTACAAA TATAATAGCC ACCAAAGACG TTATCACAAT 
ACTTAATAGA AATGTTAGTC CACCCATCGT TGGTGTACCA GTCTTCTTCA TATGGCTTTG 
TGGACCTTCT TCTCGAATAC TTTGACCAAA TTTCATCCTT TTTAATGTAG GTATTAAAAC 
AGGTACCAAA ACAAATGTAA TCACTAGCGC TAATAACGCA TATACAAAAA TCATAACTAT 
CTCCTCTTCT TAATCCAGAC TTTTTTAACC ACTAATATAT TATCAATTTT TCAATTAAAT 
AAACAAAGTT GTAATCAAAA TTTATAATTT TTCTTTTTTA CGG CAT AAG A GGCCAGTATA 
AAAAGTTTGC CTATAACAAA CAAGTTAATC TGACCTCGTC TACCTTAAAA TTCTCTATCA 
ACACTTATTT ATAAAGATTA AATGAAGATG TTGTTTTCTA TCACAGCATT ACTTTAGTAA 
AAACAAATAG TGACAATACA TCCTAATTTA ATGTAGCCAT TCTTGTTAGT CCGACTTATC 
CTTGTCAGTT ■ TTACTGTCAG ATTTCnTCTT ATCATCTGAA TTTGAATCAG AATTATTCGT 
CGAATTGCTG TCTACATTCT CTGGATGGAA AATTCTACGT 
(2) INFORMATION FOR SEQ ID NO: 160: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1186 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 160: 
ATTGCCTTTG TTTTAATTTT AAATCAAAAT mGCCTATGAA AGATTTAAAT CAATTAATTT 
CTATAATATT ATCATTTTTA AAG CAT AT CA TTGTTTAGTT TTTTTATAAT TGGATAAATA 
CTAATAGTTA CTTTATAAAA CATTACATAG AGAAAGGTTA AGGAGTGCAC ATGTCGAAAA 
AGGATCACTC TTCTTCAAAA TACCTTAATT CTGTTAAGGA AGCGCAAGAG GAGTCAAAAA 
AGAAAAATAA AAGTAATCCC AAAATTGATG TTGATCGTAC ATATATTGAA CCTCAACAAT 
TCCAATCTAA GAAACCTAAA AAAGATGATC AGGTTTTCTT CTTATCAAGA TTAAATAAAC 
CTGCAAAATA TAAGAAAGAC TCTAATTTCT TATCATATCT CATCTATCGC ATAGGAAAAG 
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TGTTGCTTTT CCTATTAACA TTATTACCAT TTTTCAATAT TAAGCAGAGT CAAATTACTA 540 

ATATGTTAAG CAATGCACCC GCTGAAACAT CTACTCTAAT TAAGAGTGTA ATTGGTGATA 600 

TAACTCAAAA CTCCAGTGGT GGCTTATTAT CTATCGGTTT GATTTTAGCA ATTTGGTCAG 660 

CTTCAAATGG AATGACTGCA ATTATGAATT CTTTCAATGT TGCTTACGAT GTAGAAGATA 720 

GCCGTAATGG AATCGTATTA AAACTACTAA GTGTTGTCTT CACTGTAGTT ATGGGCGTTG 780 

TGTTTGTAGT TGCTCTAGCA TTACCAACGC TTGGTTCTGT AATTAGTCAT TTCCTATTCG 840 

GTCCACTTGG aTTTGACGAA CAAGTGAAAT GGATTTTTAA CCTTATTAGA ATTGTGTTAC 900 

CAATCATTAT TATATTTATC ATATTTATCG TGTTATATTC GGTTGCACCT AACGTTAAAA 960 

CGAAGCTTAA GTCAGTATTA CCAGGTGCAG TATTTACTTC AATTATTTGG TTAGCTGGTT 1020 

CATTTGGTTT TGGTTGGTAT ATTTCAAATT TTGGTAACTA TTCTAAAACA TATGGCAGTA 1080 

TCGCGGGTAT CATCATTTTG TTACTATGGT TATATATCAC AAGTTTTATT ATAATTGTCG 1140 

GnGCTGAAAT CAATGCAATC ATTCATCAGC GTAGTGTAAT TAAAGG 1186 

(2) INFORMATION FOR SEQ ID NO: 161: 

25 {i) SEQUENCE CHARACTERISTICS: 

{A) LENGTH: 7872 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

30 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 161: 

TCTTGAGCCA TCTTTTGAGC TAACTGACTA GATTGATACC CAAAAATCAT AGTTACCAAC 60 

ATAAACTTTA ATTTTACCGA AGTCTAAATC AGCGATATGA GTACATACAT TATTTAAGAA 120 

ATGACGGTCA TGCGATACTA CGATAACAGT ATTATCAAAG TTAATTAAGA AATCTTCTAA 180 

CCAACTGATT GCTGGAATAT CGAGACCGTT AGTAGGCTCA TCCAGTAATA GTACGTCTGG 240 

TTCACCGAAT AAACTTTGCG CTAATAATAC TTTAATTTTT TGGTTGTTTT CTAATTCAGC 300 

CA T 'l T riTTA TCGTGTAAAG TTGGATCGAT ACCTAAACCA GATAAAAGGT TAGCAGCATC 360 

4S AGCTTCAGCA TTCCAACCAT TCATTTCTGC AAATTCACCT TCAAGTTCAG CAGCACGGAT 420 

ACCATCTTCA TCACTGAAAT CTGGCTTCAT ATAGATTTCA TCTTTTTCTT TCATAACCTC 4 80 

ATAAAGACGT TCGTGACCTT TAATTACAAC ATCAAGCACG CGTTCATCTT CATAAGCATA 540 

50 GTGGTCCTGT . TTTAAAACAG CTAGACGTTC ATTTTTCCCT AATGAAACAT GTCCTGTTTG 600 

AGAATCTAAT TCACCAGATA ATATTTTTAA GAATGTTGAT TTACCTGCAC CATTCGCACC 660 
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ATCTCCAAAA CGTAAACTCA CATCAGTTAC TTGTAACATG CATTTTCTCC TTTTTTTCAT 780 

TCGATATTCT AACGGAAGAA TTATATCATA TTATCGTCAC AGTTTCGACC TCATATAAGT 840 

TGTAATGATA GAATGACTCA CACATGTTAT AATAATAAAG AATACAAGAA TCGAAGGAGA 900 

ATAACATGGC ATTAGACAAA GATATAGTAG GTTCTATAGA ATTCCTTGAA GTAGTAGGGT 960 

TACAAGGTTC AACTTACCTT TTAAAAGGAC CAAACGGTGA AAACGTAAAG TTAAACCAAT 1020 

CAGAAATGAA CGATGATGAT GAATTAGAAG TAGGTGAAGA ATATAGTTTC TTCATTTATC 1080 

CAAACCGTTC AGGTGAATTA TTTGCAACTC AAAATATGCC TGATATTACG AAAGATAAAT 1140 

ATGACTTTGC TAAAGTACTT AAAACGGATC GCGATGGGGC ACGTATAGAT GTTGGATTAC 1200 

CCCGTGAAGT GTTAGTACCA TGGGAAGATT TACCAAAAGT GAAATCACTA TGGCCACAAC 1260 

CTGGTGATTA TTTGCTAGTT ACATTACGAA TTGACCGTGA GAATCATATG TATGGACGTT 1320 

TAGCGAGTGA ATCTGTTGTA GAAAATATGT TTACACCTGT ACACGACGAT AATTTAAAAA 1380 

ACGAaGTCAT TGAAGCCAAA CCTTACCGCG TATTACGAAT TGGTAGCTTT TTATTAAGCG 1440 

AATCAGGTTA CAAAATTTTC GTACATGAAT CAGAACGTAA AGCTGAACCA AGATTAGGTG 1500 

25 AATCTGTTCA AGTTAGAATT ATCGGGCATA ATGATAAAGG TGAGTTAAAT GGTTCATTTT 1560 

TACCACTTGC ACATGAACGT TTAGACGATG ACGGCCAAGT CATCTTTGAT TTACTAGTTG 1620 

AATATGATGG TGAATTACCA TTCTGGGACA AATCAAGCCC TGAAGCGATT AAAGAAGTAT 1680 

TCAATATGAG TAAAGGTTCA TTCAAACGTG CAATCGGTCA CTTATATAAA CAGAAGATTA 1740 

TTAATATAGA AACAGGTAAA ATCGCTTTAA CTAAAAAAGG TTGGAGTCGA ATGGACTCAA 1800 

AAGAATAATC ATTTTTACAC GTGTCGTAGG - ATGCGTGTTT TTTTTATTCA ATATTAAATC 1860 

GGACAGATGA AGTAGTTTTT TAAACATTCC TTTCAAAGTA AAAAATTAAA TAATTCAAAC 1920 

GAATAGGCTG GGaCATTAAG TTCTTAGGCA ATGTAAAAAA GCTGATTTCT ATTAATTATT 19B0 

TGATGGAAAT CAGCTTTTTT GATATGTATT TTATAATGTA CAGCTCGTTG AGCTGCTATT 2040 

TTCCTTATAT TAAGTGCCAT TAATACAAAA CCTAGCTCTC GTTTAACTTT ATTTATTCCT 2100 

CGAACTGACA TTCGAGTGAA aCCCAAAATA GCCTTCATAA ATCCAAAAAC AGGCTCTACA 2160 

TAAATTTTTC TATGACTATA GATTTTTTTC GTTTCTGGTT CAGAAAGCTT TTGaTTAATT 2220 

TGGGCTTTAA TGTATTTCAA AGTAAAATTA CATGTTAATA CGTAGTATTA ATGGCGAGAC 2280 

TCCTGAGGGA GCAGTGCCAG TCGAAGACAG GGGCCCCAAC ACAGAAGcTG ACATATAGTC 234 0 

SO AGCTTACAAC AATGTGCCGG TTGGGGTGGC TGAGACGGCA CCCTAGGAAG GGACCCGTCA 2400 

TCAAAAATTC TATTTATAGA ATTTTACAGT AATGTGACAG ACGGGCAAAG CGAAgCCATT 2460 
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CTTACTGCTG TTTTTTTAGG GATTTATGTC CCAGCCATTT TTGTATTCAT ATTTAAATTT 2580 

CGATAATTTT TCAGGAAGCA TTTTAATTTT ACTAATGAAG CAATATTTTT TAGATTAACA 2640 

AAAATTAATA TTTACATTTT CTTAACAATT TTTTATGTAA CATTTACAGT TTCTAAAAAT 2700 

GAGGTTAATA ATTCAAGGTT AAGATAAAGA TGTAATCAAT ACAAATACTA TTTGTTGTTC 2760 

ATACAGGGAG GATATTTCAA TGAAAAAATG GCAATTTGTT GGTACTACAG CTTTAGGTGC 2820 

AACACTATTA TTAGGTGCTT GTGGTGGCGG TAATGGTGGC AGTGGTAATA GTGATTTAAA 2880 

AGGGGAAGCT AAAGGTGATG GCTCATCAAC AGTAGCACCA ATTGTGGAGA AATTAAATGA 2940 

AAAATGGGCT CAAGATCACT CGGATGCTAA AATCTCAGCA GGACAAGCTG GTACAGGTGC 3000 

TGGTTTCCAA AAATTCATTG CAGGAGATAT CGACTTCGCT GATGCTTCTA GACCAATTAA 3060 

AGATGAAGAG AAGCAAAAAT TACAAGATAA GAATATCAAA TACAAAGAAT TCAAAATTGC 3120 

20 GCAAGATGGT GTAACGGTTG CTGTAAATAA AGAAAATGAT TTTGTAGATG AATTAGACAA 3180 

ACAGCAATTA AAAGCAATTT ATTCTGGAAA AGCTAAAACA TGGAAAGATG TTAATAGTAA 3240 

ATGGCCAGAT AAAAAAATAA ATGCTGTATC ACCAAACTCA AGTCATGGTA CTTATGACTT 3300 

25 CTTTGAAAAT GAAGTAATGA ATAAAGAAGA TATTAAAGCA GAAAAAAATG CTGATACAAA 3360 

TGCTATCGTT TCTTCTGTAA CGAAAAACAA AGAGGGAATC GGATACTTTG GATATAACTT 3420 

CTACGTACAA AATAAAGATA AATTAAAAGA AGTTAAAATC AAAGATGAAA ATGGTAAAGC 34 80 

AACAGAGCCT ACGAAAAAAA CAATTcAAGA TAACTCTTAT GCATTAAGTA GACCATTATT 3540 

CATTTATGTA AATGAAAAAG CATTGAAAGA TAATAAAGTA ATGTCAGAAT TTATCAAATT 3600 

CGTCTTAGAA GATAAAGGTA AAGCAGCTGA AGAAGCTGGA TATGTAGCAG CACCAGAGAA 3660 

AACATACAAA TCACAATTAG ATGATTTAAA AGCATTTATT GATAAAAATC AAAAATCAGA 3720 

CGACAAGAAA TCTGATGATA AAAAGTCTGA AGACAAAAAA TAATAAGACG CAATTTCAAA 3780 

TGTGTCTTGA AACATGATTT TGATGGTGAA TCATTATTTA GAGTACAAAG CTTGATTTAT 3840 

CGAGACGCTG ATTTTGACAT TCAGTTAGTC TAcAAGCTTA TCAACTTAAA ATAGTGGTTC 3900 

ATCATTATTT TACAAATCTA ATTATTTTGG GAGTAATAGA AAGAGGTTTG ATTATGACTT 3960 

45 CATCTACTAA TGTTAAAGCT TTAATCGAAA AAAATAATAA TAAAAAAGGA AAGCATAATG 4020 

ACAAAATTAT ACCAGTTATT TTAGCCGCAA TTTCAGCGAT TTCCATTTTA ACAACACTAG 4080 

GTATATTAAT CACATTGCTT TTAGAAACCA TCACT TT TTT CACCAGAATT CCAATAACTG 4140 

SO AATTTCTATT TTCTACTACT TGGAATCCTA CCGGTTCAGA CCCTAAGTTT GGTATCTGGG 4200 

CATTGATAAT AGGGACTTTA AAAATCACAG TTATTGCGAC TATATTTGCA GTTCCAGTCG 4260 
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AACCGATATT AGAAATTTTA GCAGGAATAC 
CCTTTGTTAC ACCAGTATTA AGATCTTTCA 
5 GTCCCGGCTT AGTTGTCGGT ATTATGATTG 

CAATGGCATC TGTACCAAAT AAAATTCGAG 
TAGAAGTAGC AACTAAAGTC GTACTTCCCG 

10 

TTCTCGCGAT TTCAAGAGCA ATTGGAGAAA 
CGCCAACAGC TTCATTAAGT TTAACAAGTT 
AGATAGCGAC AGGTGATGCA ACATTTGGAT 

15 

GGTTCACACT ATTTATCTTT ACCTTAATCA 
GTTTTAGGGA GGAGTATTAA TATGGAAACG 

2Q CAACAACTTG TCCAAAAACA TTTATCATCC 

ATATTTTTAG CATGTACATT ATTAGGACTT 
TTGATTAAAG GGGTAAGTCA TTTAAATTTA 

25 CCATCTATGG CTGGCGTTAA AGGCGCGTTA 

ATTCCATTAT CAATCATCCT AGGAATAGGT 
AACAACAAAT TTACTCAGTT TGTTAAAATC 

30 GTTGTATTTG GGTTATTAGG TTATACTTTG 

AAAATGGGTA ACAGTATATT GGCAGCAGCG 
ATTATTGTTT CAAGTCAGGA AGCAATTAGA 

35 

ACGGCTTAGG TGCTAATAAA TGGCAAACGA 
CTGCTATTTT AACTGGATTC ATTTTGTCTC 
TTGTGCTAAT CGGTATACCG ACTATATTAT 

40 

TTTCAGCATT ACCTATCCAA ATATTTACTT 
ATGTTGCATC GGCAGGCATT ATCGTTTTAC 

4S CGATTATTTT ACGTAACAAA TTTAGTAAAA 

TCTATTAAAA AGGGAGTTTT AAATATGGCG 
CAAAGTCATA CGTTTGATGT CTCACAAAGT 

50 CATTCTGTTA TATATTCAAC ACAAAATTTA 

CAAAATATTA ATTTAGATAT TTATGAAAAC 

55 



CAACAATTGT GTTTGGTTTC TTTGCATTAA 4 380 

TACCAGGTCT TGGAGAGTTT AATGCTATAA 444 0 

TCCCTCTCAT CACAAGTTTG AGTGAGGaTG 4 500 

AAGGTGCCTA TGGACTTGGA GCAACTAAAT 4560 

CAGCAACATC AGGTATTGTA GCTTCAATCG 4 620 

CGATGATTGT ATCATTAGCG GCAGGTAGTT 4 680 
CGATTCAAAC AATGACTGGA TATATTGTTG . 4 740 

CAAATATTTA TTACAGTATT TATGCTGTAG 4800 

TGAATTTACT TTCTCAGTGG ATTTCTAAGC 4 860 

ACAGATAATA ATAGACAATC ACTCGTCGAT 4920 

AGAACGGTTA AAAATAAAGT GTTCAAACTC 4 980 

GTCGTACTTA TTGCGTTGTT AACTCAAACA 5040 

CAGTTTTTCA CTAATTTTTC TTCTTCAACA 5100 

ATCGGTTCAC TTTGGTTAAT GTTAAGTATC 5160 

ACAGCTATAT ACTTAGAAGA ATATGCGAAA 5220 

AGTATTTCCA ATTTAGCTGG TGTACCATCA 52 80 

TTCGTTGGTG GTGCAGGGAT TGAAGCCTTG 5340 

CTAACAATGA CCTTACTGAT ATTACCAATT 54 00 

GCTGTACCTA ACTCAGTACG CGAACTTcTT 54 60 

TAAGACGTGT TGTCTTACCA GCAGCGTTAC 5520 

TTTCAAGAGC ACTGGGAGAA ACAGCGCCAC 5580 

TGGCAACACC TAGAAGTATA TTGGATCAAT 5640 

GGGCGAAAAT GCCTCAAGAA GAATTCCAGA 5700 

TAGTTATCTT AATCTTAATG AATGGCGTTG 5760 

AATTCTAATT TAAACAATCA ATCTCATTTA 5820 

CAAACACTTG CACAAACTAA ACAAATATCT 5880 

CATCATAAAA CACCAGATGA TACAAACTCA 5940 

GACTTATGGT ATGGCGAAAA TCATGCATTA 6000 

CAAATTACTG CCATTATAGG TCCATCTGGT 6060 
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AAAACAGCTG GTAAAATATT ATATCGAGAT CAAGACATTT TTGATCAAAA ATATTCTAAA 6180 

GAACAATTAC GTACAAATGT GGGCATGGTC TTTCAACAAC CTAATCCATT TCCAAAATCA 6240 

ATATACGATA ATATTACTTA CGGTCCAAAG ATTCACGGTA TTAAAAATAA AAAAGTTCTT 63 00 

GATGAAATCG TTGAGAAATC ATTACGTGGC GCTGCAATTT GGGATGAATT AAAGGATAGG 6360 

TtGCACACAA ATGCATATAG TTTATCCGGT GGGCAACAAC AACGTGTTTG TATCGCGCGT 6420 

TGTTTAGCAA TTGAACCTGA AGTCATTTTA ATGGATGAAC CGACATCAGC ATTAGATCCA 64 80 

ATCTCAACAT TAAGAGTAGA AGAGTTGGTT CAAGAACTAA AAGAAAAGTA TACAATTATT 6540 

ATGGTtACAC ATAATATGCA ACAAGCAGCT CGTGTATCAG ATAAAACTGC ATTTTTCTTA 6600 

AATGGTTATG TCAATGAATA TGATGATACT GATAAAATTT TCTCTAACCC ATCAAACAAG 6660 

AAAACAGAAG ATTATATTTC AGGAAGGTTT GGTTGATATA TAATGGCAAT AATTAGACAA 6720 

CGATATCAGG AGCAACTTGA TGATTTAATA AAAGAATTAC GTCGGTTAGG TGCaAATGTC 6780 

TATGTGAGTA TTGaAAATGG TATAAAAtCA TTAAGTATTG aCGATAGAGG cTTTGCACGA 6840 

CAAACAGTTA AAAACGATAA ACATATCAAT CAATTAAATT ATGATATTAA TGAGCGAGTT 6 900 

25 ATCATGTTAA TTACAAAGCA ACAGCCCATT GCGAGTGATT TGCGTATGAT GATTTCTTCA 6960 

TTAAAAATCG CCTCCGATTT AGAAAGAATA GGAGATAATG CCTCGAGTAT TGCCAATATT 7020 

CGATTGCGTA CAAAGATTAC AGATGATTAT GTGTTAACCC GTTTAAAGAC AATGGGTAAA 7080 

30 TTAGCTATGT TAATGTTAAA GGACTTAGAT CAAGCATTTA AAAAGAAAGA TACCGTATTA 7140 

ATAAGAGAAA TAATTGAGCG TGATGAAGAT ATCGATGACT TATATAGTCA TATTATTAAC 7200 

GCAACGTATC TTATTGATAA CGtCCATTTG TCGCTGCACA AGCTCATTTA GCAGCAAGAC 7260 

ATTTAGAACG TATTGGTGAT CATATTATTA ACATCGCTGA AAGTGTTTAT TTTTATTTAA 7320 

CAGGTACACA TTACGAACAA TAACTTAAAG TTATTACTAT AAAATCCCTT ACGATAAATA 73 80 

TATATTTCTA TTATTGATAA ACCCTCAAAA AAACCAAGAT TCTCACAATT AGTAATGTGA 7440 

AAATCTTGGT TTATATTGTT CTACTATAAA TTGTCTCGCA TCTTAGTTAT TTGCTTGCTC 7500 

AATTTCATCT GTTAATTTTT CAACTTCATC GACTAAATCA GAAATATATT GAATTGTAGA 7560 

TTTAAGTGGC TGTTCTGTAG TAATGTCTAC ACCTGCAATG TTTGCAAGTT CGACAGGTGA 7620 

TACACTACCA CCTTTTTTCA ATGTTTCTAA CCAAGCATCA ACAGCTGGTT GGCCTTCATT 7680 

TTTAATCTTT TGAGAAACGA CAGTTCCGAT TGTTAAGCCA GCAGAATACG TATACGAATA 7740 

50 TAATCCCATA TAGTAATGAG GTTGACGCAT CCATGTTAAT TCAGCACCCT CAGTCATGTC 7800 

TACTGCATCT CCAAAAAATT GTTTATAAAC ATTTAGCATT ATTTCATTTA ATGTnCGGCG 7860. 
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(2) INFORMATION FOR SEQ ID NO: 162: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 798 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xl) SEQUENCE DESCRIPTION: SEQ ID NO: 162: 
TTTTTTCTTT TCTTCATTTG AAAATTGATC ATTCAGCAAT ATAAGCGTAT TTGTTAATGA 
TTTAGGTGTT CCAATTTCAT AATCCCACCA ATTTAAGTTG GTATTCTTGC CAGTTGTTTT 
AGTAAAATTC TCACTTAATT CTTTTACTTT TTTATCTGGT TCTTTTCCAT ATGCATTTTT 
ATGCAGCCAC TCAAGGGCAT CTTTCACTTT CTTCTTATTT TCGTCAGTAT TTAAAGTGGT 
TTTAGGATTC CTCATCGCTT CTGCGATTTT CTCAATATTA CGATAGGTAC GAGTCATATG 
AGAAGAATTA GTTTCAAGGG TTTCCGCTCC TGACCACAAG TATTTCCTAC CACTTTCAGT 
TTTCATTTCC TTGAGTAAAT TCGTCGCCTC TTTCTCTGTA GCATCAAACT TCTTCTTCAT 
ATCTGGATTA TTCTCATCAT ACTTATCATA ACCATAGTTA ACGTCCAGCC ATGTGTTCCT 
CAATTTTTCA TAATCTGGCG TTTGAACATT CGTATCAGCC ACAGCGATTT GATGTTTATC 
AACACTTCTG AATTCACCAC CATTCAAAGT AATCACACCA GCCATTAATA ACGTAATGGT 
GGATAATTTT TGCCATTTCT TTATTCTATA TGTCATTGaC ATGTCTCCTT TTTGTGTTGC 
GCGTGCGCAA TGAATATTAT GATTAAATAA TGATTCAATT TTTCAAAATT CGTTAACGTA 
TACAAATGAC TGTCTACTGT CAAACAATCC ACAAAGAATG TTGATGtCAT ATaAACAATC 
GATCACCCAA ATTTTCCG 

(2) .INFORMATION FOR SEQ ID NO: 163: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5132 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION : SEQ ID NO: 163: 
TACAGGTTTT ACTATAATGG ATGGTATTTT GGCTAAACGA CATTGGTTTA GTCTTCTTTT 
TTTnACTTCC TAnATTTACA ATGGTATAAA TAATAATGCT ATATTTAGAA TGATGAGTAT 
ACTTACTGAA ACTAAATTAA AAGTGTCTGG TTCTTTACTA AAGATAGCTG CTATCCTTGC 
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AATACAAGTT CCAATGAGCG CAATTAAAAG TACTAACCCA ACGATGAAAC TCTGTTTGTC 300 

ACTTAACTCA AAGAAACTAT AGATAGGATA TTTTTTAATA ATCAAGCCAC CTAAAATCAT 360 

CCATAAAAAT ACGATAATTC CATAAGTCAC ATTTATAACA TACGTTATTT TTTGGTCACC 420 

AAATCGGACT AATGTATTTC GTAGAATCAG CATACCAATG ACAACACCTA AAATAACGAT 4 80 

ACTAGCTATA TAAAGTAAAA ATGCAATTGT CACATCAAAT GTACCCAAAT CTAAAAACCT 540 

AGGAATTAyA AyGACTGCTA AAATAAAAGC GAAGyACAAA GTAATATAkT TATACAAACC 600 

GGTAGTAAGA CTTATCTCAG GTGATAATTG ATCAGCCATT GACTTAATCG GTGTATTAAT 660 

AATTGAACTT GTATCTTCGT TATTTTTTTC AGCCATAGTT AAATGATCTT CGAGCTCTTC 720 

CAATAACTCT TCTACTTCTG CTTCAGTCTT ACCTCTAAAT AACAATTCAA CACGTAATTT 780 

TTCTAAAAAA TCTTGAGATT GTTTACTTAA CATCGTTTTC CCCTCCAAAC AAGTTAATCA 840 

TCCCTTTATT CAAAACTTGC CATTTCGATT TAAATACTTT TAGTTCCTTT AAACCTGAAT 900 

CGGTAATCGT ATAGTATTTC CGCCTCGGGC CGCCATTACT AGATTTTTTT ATTGTCGTAT 960 

CAACGTATCC TTTTTTGTTT AAACGCATTA AAACTGGATA AATACTACCC TCACTTATCT 1020 

2$ CTGGAAACTC TTGATTCTTA AGTTTCGTCA TAATTTCATA TCCATACGTT TCGCCTTGGG 108 0 

CAATGAGACC TAATATCGCC CCATCTAAGA GACCTTTCAT AATCTGATCT GACACTGACA 1140 

TTTTAATCAC CTACTATCTT ACATAATAAG ATAGTACATT GAGAACTTTT CGTCAACTAT 1200 

30 CTTTTATTGT AAGGTAGTTG TTGTACACAT TCCTTAAATG ACTAACAACT TTGTTAATAG 1260 

GGTAATACTT ACGGAAGTAT ATTTTATTTA TGGGGGAGGA ATTAATAATG ACTACAAAAA 1320 

CAGTATTTGA TGTCATTGAT ATGGGGTTAG GATATTTAGT AAATGTGTAT GATGCTTGGA 1380 

AAGTTGAAAA GGTACTTGAT GATTATCATA AGCCTTTTTC TAATACCATT CATTGGCAAT 1440 

TTGGtCATGT ATTAACAATT TTTGAATCGG CCTTAGCTGT TGCTGGTAAA GAGAATATTG 1500 

ATTTAAATAT CTATAGACCT TTATTCGGAA ATGGTTCGTC TCCAGATGAA TGGAAGGATG 1560 

AAGTACCGAG TATTGAAAGG ATTTTAGAAG GTCTCCAAAC TTTACCTGAA CGTGCACGAA 1620 

ATCTAACTGA AGATGATTTA GCAATTGAAT TGAAACAGCC AATTGTCGGT TGTAATAACT 168 0 

TAGAAGAGTT ATTAGTATTA AATGCCATTC ACATCCCACT TCATGCTGGT AAAATTGAAG 1740 

AGATGTCTCG TATATTAAAA AATTTAAAAT AAATATGTGC TTATTAACCG TTAACAACAC 1800 

GTTAACGGgT TTTTTATTTG TTTAAAAGGT CACTTTTTTG AATTTAATAA ACACCATCTA 1860 

SO TACCAGTTCT TCACCGATTC TCGAAAAATA ATTATATTAA TGATTTCGTT AATTTAATTT 1920 

TATATTTAAT TATTACTGTA CATCTTTTGT AGTTAGCTTT ATTCTTAAAT TGAAATATGT 1980 
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TACTCCCTAT CGTTGTAGGT CTCCTTATTT GGGCACTTAC ACCTTTTAAA CCGGATGCTG 2100 

TGGATCCAAC AGCATGGTAT ATGTTCGCAA TATTCGTCGC GACAATCATT GCTTGTATTA 2160 

5 CACAACCGAT GCCAATTGGG GCCGTCTCTA TAATTGGATT TACAATCATG GTACTCGTTG 2220 

GCATTGTTGA CATGAAAACG GCTGTCGCTG GTTTTGGTAA TAATAGCATT TGGTTAATTG 2280 

CTATGGCATT TTTCATTTCG AGAGGATTTG TGAAAACAGG TCTTGGTAGA CGTATCGCAC 2340 

10 

TTCATTTCGT CAAATTATTT GGTAAAAAAA CATTAGGATT AGCATATTCT ATCGTCGGTG 24 00 

TAGATTTAAT TCTAGCGCCT GCTACACCAA GTAATACCGC GCGTGCTGGT GGAATCATGT 2460 

TCCCAATTAT CAAATCACTT TCTGAATCAT TTGGTTCGAA ACCGAAAGAC GGATCAGCAC 2520 

75 

GCAAAATGGG TGCATTTCTT GTTTTCACAG AATTCCAAGG TAATTTAATT ACTGCGGCTA 2580 

TGTTTTTAAC TGCAATGGCC GGTAACCCCC TTGCACAAAA TTTAGCATCT AGCACATCTA 2640 

20 ATGTTCACAT TACATGGATG AATTGGTTTC TAGCTGCTTT AGTTCCTGGA CTTGTTTCCT 2700 

TAATTGTTGT ACCTTTTATT ATTTATAAAA TTTATCCACC AACTGTTAAA GAAACACCAA 2760 

ATGCTAAGAG TTGGGCTGAA AATGAATTAG CGACTATGGG TAAAATCGCT TTAGCTGAAA 2 820 

25 AATTTATGAT TGGTATTTTT GTCGTTGCGT TAACACTATG GATTGTCGGA AGTTTCATTC 2 880 

ATATTGATGC AACTTTAACG GCCTTTATTG CGCTAgcATT gTTATTATTG ACAGGCGTCT 2 940 

TAACATGGCA AGACATTTTA AACGAAACAG GTGCTTGGAA CACATTAGTA TGGTTCTCAG 3 000 

30 TATTAGTGTT AATGGCCGAC CAATTAAACA AGCTTGGATT TATTCCTTGG TTAAGTAAAT 3 060 

CCATTGCTAC AAGTCTTGGT GGCTTAAGCT GGCCTATAGT CCTGGTCATT TTAATATTGT 3120 

TCTACTTCTA TTCACATTAC TTATTTGCAA GTTCTACAGC ACATATCAGT GCGATGTATG 3180 

35 \ 

CAGCATTACT AGgCGTTGCC ATCGCAGCCG GTGCACCACC ATTATTCAGT GCATTAATGT 3240 

TAGGTTTCT T CGGTAACCTA TTAGCTTCAA CAACACACTA TAGTAGTGGT CCAGCGCCGA 3 300 

TTCTATTCTC TTCAGGTTAC GTGACTCAAA AACGTTGGTG GACAATGAAC TTAATATTAG 3360 

40 

GTTTCGTCTA CTTTATTATC TGGATTGGTT TAGGATCACT TTGGATGAAA GTAATTGGTA 3420 

TATTTTAAAA TATTTAAATT AGCGCTCGAA TCTCATTGAT TTGGGCGCTT TTTAATTTGT 34 80 

45 ATTTAAAATC AACCTTTGCT AAATCAAGAC TCCCTTTTTA AAATACGTTT ATCCTTTAAA 3540 

TCATTGCGTG CTTCACTGAA AATTTGTATA AAGATTTAAG TCATTACGTA ACATCACATA 3600 

AAATACATTT CTATACTATT CCGCTTCATT GATTAACATT ACGTATGCCC TCATAAATCA 3660 

50 TCATACAAAA AACACCTTCG TTTAAATTCA TTTTAATTGC GAATTCAACG AAAGTGCCTT 3720 

ATTTCATATT TAATGTTTCA AATTTATACG TCTGTCACTG TTACTGCACA CATACCTCAG 3780 
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TTATAGGGTT TTTGCGACCG GATGTTTCTT CAATTTAATG TATTGAGAAA GACTATATAA 3900 

CACAATACCT GTCCAAATAA ATATAAACGT AATTAATTGA TCTATACTAA AAGGCTCTTT 3960 

5 GAAAACAAAT ATGCCGAGTA CAAACATTAT TGTTGGTCCA ACGTATTGAA TAAATCCTAT 4020 

TAGCGAAAGT GGAATACGTT TTGCCCCGGC TGAGAATAGG ATTAGTGGTA TTGCCGTAAT 4080 

AGCACCAGAA AATAACAACC AAAATGATGA CATGTTCAAT CCAAATGACA TCTGATGTTG 414 0 

10 

CTGCCATAAA TAAATAACGT ATATTAGTCC AGCAGGTGCG GTAACAATAC ATTCAATCGT ' 4200 

AATACTGCTG ATGGCATCAA TATGTACTAC TTTTTTCAAT AATCCGTATG TACCAAAGGA 4.260 

TAACGCTAAT ATAATAGAGA CGATTGGGAA TTCTCCAATC TTGAGCGTCA TATATAATAC 4320 

15 

ACCGATGAAT GCGAATAAAA TGGCTAGCCA TTCAAATTTA TTGAATCTTT CTTTTAAAAA 4380 

GATAAGTGCG AGCAAAATGC TAACAAGTGG ATTTATATAA TAACCTAAAC TTGTTTGTAG 4440 

2Q GACGTGACCG TTCGTTACAG CCCAAATAAA TGTACCCCAA TTTAATGTAA TGACATAGCC 4500 

TGCTACGACA ATCGCTAATA GCTGAATGGG CTTGCCTAAC AATTGATTCA TATCTCGTTG 4560 

AAATGCATTG CGTTGTTTTT GTCCAACCGC GAGTATGAAA ATCATGAATA TTGCTGAAAA 4 620 

25 TATAATACGA AAGGCTAAAA TTTCAAATGC GCCTATTGCA TCAACGAACT GCCAATATAT 4680 

AGGTAGTATT CCCCACAGAA TGTATGCACT GAGTGCTAAA AATATGCCTT TTTTATACTC 4740 

TGAATTCACC TTCAAACCTC CTTACTTTCC TAATTTTTAA TTTACTGCAT ACGCTCACTT 4 8 00 

30 GGTTATGCTA ATATAACGAT TTTACTAATA ATATTTCGAT AAAGATATCA TTTTGTTTAT 4860 

ATTTCCCACA TTTATTCACC AACCACTAAA CAATATTAAT TTTATAAATA ATTCTGTACA 4 920 

AATCAGGGTA TATTGCCAGA AAGACTACCA TACAACATAA AGGATGGATA CAAATGACTT 4980 

35 

TACCTAAAAT TGGAAAGCCT GCAACACGCG CGCTAAATTC ACAAGGTATA TACACATTAG 5040 

AAGCAGTATC ACAATATACG AAGTCATCTC TAATGGAGAT GCATGGCGTT GGTCCTAAAG 5100 

CTATATCAAT ATTGGAACAA GCTTTATTTC AG 5132 

40 

(2) INFORMATION FOR SEQ ID NO: 164: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 22243 base pairs 
4S (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

50 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 164: 

AAGTAAATTA TATTATGAAT TTGCCTGTCA ATTTCTTAAA GACATTCTTA CCGGAACTAA 60 
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TAGAAGCAAT TAATAATGCy mAAGAAAAGA CAGCTAATAA TACCGGCTTA AAATTAATAT 180 

TTGCAATTAA TTATGGTGGC AGAGCAGAAC TTGTTCATAG TATTAAAAAT ATGTTTGACG 24 0 

AGCTTCATCA ACAAGGTTTA AATAGTGATA TCATAGATGA AACATATATA AACAATCATT 300 

TAATGACAAA AGACTATCCT GATCCAGAGT TGTTAATTCG TACTTCAGGA GAACAAAGAA 360 

TAAGTAATTT CTTGATTTGG CAAGTTTCGT ATAGTGAATT TATCTTTAAT CAAAAATTAT 420 

GGCCTGACTT TGACGAAGAT GAATTAATTA AATGTATAAA AATTTATCAG TCACGTCAAA 480 

GACGCTTTGG CGGATTGAGT GAGGAGTAGT ATAGTATGAA AGTTAGAACG CTGACAGCTA 540 

TTATTGCCTT AATCGTATTC TTGCCTATCT TGTTAAAAGG CGGCCTTGTG TTAATGATAT 600 

TTGCTAATAT ATTAGCATTG ATTGCATTAA AAGAATTGTT GAATATGAAT ATGATTAAAT 660 

TTGTTTCAGT TCCTGGTTTA ATTAGTGCAG TTGGTCTTAT CATCATTATG TTGCCACAAC 720 

20 ATGCAGGGCC ATGGGTACAA GTAATTCAAT TAAAAAGTTT AATTGCAATG AGCTTTATTG 780 

TATTAAGTTA TACTGTCTTA TCTAAAAACA GATTTAGTTT TATGGATGCT GCATTTTGCT 840 

TAATGTCTGT GGCTTATGTA GGCATTGGTT TTATGTTCTT TTATGAAACG AGATCAGAAG 900 

25 GATTACATTA CATATTATAT GCCTTTTTAA TTGTTTGGCT TACAGATACA GGGGCTTACT 960 

TGTTTGGTAA AATGATGGGT AAACATAAGC TTTGGCCAGT AATAAGTCCG AATAAAACAA 1020 

TCGAAGGATT CATAGGTGGC TTGTTCTGTA GTTTGATAGT ACCACTTGCA ATGTTATATT 1080 

TTGTAGATTT GAATATGAAT GTATGGATAT TACTTGGAGT GACATTGATT TTAAGTTTAT 114 0 

TTGGTCAATT AGGTGATTTA GTGGAATCAG GATTTAAGCG TCATTTCGGC GTTAAAGACT 1200 

CAGGTCGAAT ACTACCTGGA CACGGTGGTA TTTTAGACCG ATTTGACAGC TTTATGTTTG 1260 

TGTTACCATT ATTAAATATT TTATTAATAC AATCTTAATG CTGAGAACAA ATCAATAAAC 1320 

GTAAAGAGGA GTTGCTGAGA TAATTTAATG AATCTCAGAA CTCCTTTTGA AAATTATACG 1380 

CAATATTAAC TTTGAAAATT ATACGCAATA TTAACTTTGA AAATTAGACG TTATATTTTG 1440 

TGATTTGTCA G TAT CAT ATT ATAATGACTT ATGTTACGTA TACAGCAATC ATTTTTAAAA 1500 

TAAAAGAAAT TTATAAACAA TCGAGGTGTA GCGAGTGAGC TATTTAGTTA CAATAATTGC 1560 

45 ATTTATTATT GTTTTTGGTG TACTAGTAAC TGTTCATGAA TATGGCCATA TGTTTTTTGC 1620 

GAAAAGAGCA GGCATTATGT GTCCAGAATT TGCGATCGGT ATGGGGCCAA AAATTTTTAG 16 80 

TTTTAGAAAA AATGAAACAC TTTACACTAT TAGGTTATTG CCTGTTGGTG GATATGTTCG 1740 

50 TATGGCAGGA GATGGCTTAG AAGAGCCACC AGTCGAGCCC GGTATGAACG TTAAAATTAA 1800 

ACTTAATGAA GAAAATGAAA TAACACATAT CATATTAGAT GATCATCATA AGTTTCAACA i860 
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CACTGCTTAT GATAATGAAA GACATCATTT TAAAATTGCT AGAAAGTCTT TCTTTGTTGA 1980 

AAATGGTAGC TTAGTTCAAA TTGCTCCGAG AGACAGACAA TTTGCACATA AAAAGCCATG 204 0 

GCCGAAATTT TTAACATTAT TTGCGGGACC GTTATTTAAC TTTATATTAG CTTTAGTCCT 2100 

ATTTATTGGT CTTGCATATT ATCaAGGcAC GCcTACGTCT ACTGTAGAAC AAGTCGCAGA 2160 

TAAGTATCCA GCTCAACAAG CAGGATTACA AAAAGGTGAT AAGATCGTCC AAATTGGCAA 2220 

ATATAAAATA TCTGAATTTG ATGATGTTGA TAAGGCGTTA GATAAAGTTA AAGATAATAA 2280 

GACGACTGTT AAATTTGAAC GTGATGGTAA AACAAAGTCA GTTGAATTAA CACCTAAAAA 2340 

GACTGAAAAA AAACTGACTA AAGTAAGTTC AGAGACGAAG TATGTTCTCG GATTCCAACC 2400 

AGCGAGTGAA CATACACTTT TTAAACCAAT TGTATTCGGA TTTAAAAGCT TTTTAATCGG 2460 

TAGTACTTAT ATTTTTACAG CTGTAGTAGG TATGTTGGCT AGTATATTTA CGGGCGGATT 2520 

20 CTCATTTGAT ATGTTAAATG GTCCGGTTGG TATTTATCAT AACGTCGACT CAGTTGTTAA 2580 

AGCGGGTATC ATTAGCTTAA TTGGTtnCAC TGCGTTATTA AGTGTAAACT TAGGTATTAT 2640 

GAATTTAATT CCTATTCCTG CACTAGACGG TGGTCGTATT TTATTTGTTA TATATGAAGC 2700 

25 GATTTTCAGA AAACCAGTTA ATAAAAAAGC GGAAACAACG ATTATTGCTA TTGGTGCCAT 2760 

TTTCATGGTC GTTATAATGA TATTAGTAAC GTGGAATGAT ATTCGACGAT ATTTCTTATA 2820 

ATTTAGGAGG ATAAATAATT ATGAAGCAAT CCAAAGTTTT TATACCAACG ATGCGTGACG 2880 

TGCCATCAGA AGCAGAAGCA CAAAGTCATC GTTTATTATT GAAATCGGGT TTGATAAAAC 2940 

AAAGTACAAG TGGGATTTAT AGTTATTTAC CGCTAGCAAC ACGTGTGTTA AATAATATTA 3000 

CTGCAATTGT GCGACAAGAA ATGGAACGTA TCGATTCTGT TGAAATTTTA ATGCCAGCGT 3060 

TACAACAAGC TGAATTATGG GAAGAATCAG GACGTTGGGG TGCATATGGC CCAGAATTAA 3120 

TGCGTTTACA AGATAGaCAT GGAAgACAAT TTgCATTAGG TCCaACACAT GAAGAATTAG 3180 

TTACATCAAT AGTAAGAAAT GAATTGAAAT CATACAAACA ATTACCGATG ACATTATTCC 3240 

aAATTCAATC TAAATTCCGT GATGAAAAGA GACCACGTTT TGGTTTAyTC GTGGGCGTGA 3300 

ATTTATTATG AAAGATGCAT ATTCATTCCA TGCTGACGAG GCATCATTAG ATCAAACGTA 3360 

45 TCAAGATATG TATCAAGCGT ATAGCCGTAT TTTTGAGAGA GTTGGCATTA ACGCAAGACC 3420 

AGTAGTTGCA GATTCAGGTG CTATAGGCGG TAGCCATaCA CATGAATTTA TGGCATTAAG 3480 

TGCTATCGGT GAGGATACAA TCGTTTACAG TAAAGAAAGT GATTATGCTG CTAACATCGA 3 540 

50 AAAAGCAGAA GTCGTTTACG ArcCAaATcA TaAGCATACT ACTGTGCAAC CTTTAGAAAA 3600 

AATTGAAACA CCAAATGTTA AGACTGCGCA AGAATTGGCA GACTTCTTAG GTAGACCAGT 3660 
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GCGTGGCCAT CATGAAATTA ATGACATTAA ATTAAAATCT TATTTCGGCA CAGATAATAT 3780 

TGAATTAGCA ACACAAGACG AAATTGTTAA TTTAGTTGGT GCAAATCCTG GTTCACTAGG 3840 

TCCTGTAATT GATAAAGAAA TCAAAATTTA TGCAGATAAT TTTGTGCAAG ATTTAAATAA 3 900 

TTTAGTTGTC GGTGCTAACG AAGATGGTTA TCACTTAATT AATGTAAATG TAGGTAGAGA 3960 

CTTCAACGTT GATGAATATG GCGATTTCCG TTTTATTTTA GAAGGCGAAA AGTTAAGTGA 4020 

TGGTTCAGGC GTTGCACATT TTGCTGAAGG TATTGAAGTT GGTCAAGTAT TCAAATTGGG 4080 

TACTAAGTAT TCAGAATCAA TGAATGCTAC ATTCTTAGAT AACCAAGGAA AAGCTCAATC 4140 

TTTAATTATG GGTTGTTACG GAATTGGAAT TTCTAGAACG CTAAGTGCGA TTGTTGAACA 4200 

AAATCACGAT GATAATGGAA TTGTTTGGCC TAAATCAGTT ACTCCGTTTG ATTTACATTT 4260 

AATTTCTATT AATCCTAAGA AAGATGATCA ACGAGAACTA GCAGATGCAC TATATGGTGA 4320 

ATTTAATACT AAATTTGATG TGTTGTACGA TGATCGTCAG GAACGTGCAG GTGTTAAATT 43 80 

TAATGATGCC GATTTAATTG GTTTACCACT GCGAATTGTT GTTGGTAAAC GTGCATCGGA 4440 

AGGTATTGTA GAAGTTAAAG AACGTTTAAC AGGTGATAGC GAAGAAGTTC- ACATTGATGA 4 500 

2s CTTAATGACT GTCATTACAA ATAAATATGA TAACTTAAAA TAATTAAGAT CGAATGAATT 4560 

ATAAGAGTAG GAAAAAGCTG AAAGAAATCT GATGCTTATG TCCTGCTCTT ATTATTTTTG 4620 

ATATAATGAT TATTCGATGA AAAATGACTG AAGACATAGT ATAATTAAAG ATAAATTTGT 46 80 

30 TTTAACAATA TAATGATTAG CCAAATATAA AGCATTTAAT TTTCTATCAT TACTATGCTC 474 0 

ACATAATCTA AATATTGTTC GAACACGTAA AAGTAATTTC TATTTAAGGT GGTAATTGTC 4800 

TTGGCAATGA CAGAGCAACA AAAATTTAAA GTGCTTGCTG ATCAAATTAA AATTTCAAAT 4860 

CAATTAGATG CTGAAATTTT AAATTCAGGT GAACTGACAC GTATAGATGT TTCTAACAAA 4920 

AACAGAACAT GGGAATTTCA TATTACATTA CCACAATTCT TAGCTCATGA AGATTATTTA 4980 

TTATTTATAA ATGCAATAGA GCAAGAGTTT AAAGATATCG CCAACGTTAC ATGTCGTTTT 5040 

ACGGTAACAA ATGGCACGAA TCAAGATGAA CATGCAATTA AATACTTTGG GCACTGTATT 5100 

GACCAAACAG CTTTATCTCC AAAAGTTAAA GGTCAATTGA AACAGAAAAA GCTTATTATG 5160 

TCTGGAAAAG TATTAAAAGT AATGGTATCA AATGACATTG AACGTAATCA TTTTGATAAG 5220 

GCATGTAATG GAAGTCTTAT CAAAGCGTTT AGAAATTGTG GTTTTGATAT CGATAAAATC 5280 

ATATTCGAAA CAAATGATAA TGATCAAGAA CAAAACTTAG CTTCTTTAGA AgCACaTATT 534 0 

50 CAAGAAGAAG ACGAACAAAG TGCACGATTG GCAACAGAGA AACTTGAAAA AATGAAAGCT 5400 

GAAAAAGCGA AACAACAAGA TAACAACGAA AGTGCTGTCG ATAAGTGTCA AATTGGTAAG 5460 
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GCAATAGAGG GTGTCATTTT TGATATAAAC 
GTAGAAATTA AAGTGACTGA CTATACGGAC 
AACAAAGATG ATTTAGAACA TTTTAAAGCG 
GGTCGTATTG AAGAAGATAC ATTTATTAGA 
GAGATTAAAA AAGCGACAAA AAAAGATAAG 
CATACTGCAA TGAGCCAAAT GGATGGTATA 
GCAGACTGGG GACATCCAGC GATTGCGGTT 
GATGCTCACG CAGCAGCGGA AAAACATGGC 
TTAGTTGATG ATGGTGTTCC GATTGCATAC 
ACTTATGTTG TGTTCGACGT TGAGACAACT 
GAGCTTGCAG CTGTGAAAGT TCATAACGGT 
AATCCGCATG AACGATTATC GGAAACGATT 
TTAGTAGATG CCCCTGAGAT TGAAGAAGTA 
GCGATATTCG TAGCGCATAA TGCTTCGTTT 
CGTCTTGGGT TTGGACCATC AACGAATGGT 
ATTAATACTG AATATGGTAA ACATGGTTTG 
TTAACGCAAC ATCACCGTGC CATTTATGAT 
ATGGTTCAAC AAATGAAAGA ATTAGGCGTA 
AGTAATGAAG ATGCATATAA ACGTGCAAGA 
CAACAAGGTC TTAAAAATCT ATTTAAAATT 
CGTAGACCTC GAATTCCACG TTCATTGTTA 
ACAGCGTGTG ATGAAGGTGA ATTATTTACG 
GAAAAAATTG CCAAATATTA TGATTTTATT 
TTAATTGATA GAGAGCTTAT TAGAGATACT 
ATACATGCAG GTGACACAGC GGGTATACCT 
TTTGAACATG ATGGTATCGC ACGTAAAATT 
AATCGCTCAA CTTTACCGGA AGCACATTTT 
CATTTTTTAG GTGAAGAAAA AGCGCATGAA 
GATCGAATTG AACGTGTTGT TCCTATTAAA 



TTAAAAGAAC TTAAAAGTGG TCGCCATATC 
TCTTTAGTTT TAAAAATGTT TACTCGTAAA 
CTAAGTGTTG GTAAATGGGT TAGGGCTCAA 
GATTTAGTTA TGATGATGTC TGATATTGAA 
GCTGAAGAAA AGCGTGTAGA ATTCCACTTG 
CCCAATATTG GTGCGTATGT TAAACAGGCA 
ACAGACCATA ATGTTGTGCA AGCATTTCCA 
ATTAAAATGA TATACGGTAT GGAAGGTATG 
AAACCACAAG ATGTCGTATT AAAAGATGCT 
GGTTTATCAA ATCAGTATGA TAAAATCATC 
GAAATCATCG ATAAGTTTGA AAGGTTTAGT 
ATCAATTTGA CGCATATTAC TGATGATATG 
CTTACAGAGT TTAAAGAATG GGTTGGCGAT 
GATATGGGCT TCATCGATAC GGGATATGAA 
GTTATCGATA CTTTAGAATT ATCTCGTACG 
AATTTCTTGG CTAAAAAATA TGGCGTAGAA 
ACAGAAGCAA CAGCTTACAT TTTCATAAAA 
TTAAATCATA ACGAAATCAA CAAAAAACTC 
CCTAGTCATG TCACATTAAT TGTACAAAAC 
GTAAGTGCAT CATTGGTGAA GTATTTCTAC 
GATGAATATC GTGAGGGATT ATTGGTAGGT 
GCAGTTATGC AGAAGGACCA GAGTCAAGTT 
GAAATTCAAC CACCGGCACT TTATCAAGAT 
GAAACATTAC ATGAAATTTA TCAACGTTTA 
GTTATTGCGA CAGGAAATGC ACACTATTTG 
TTAATAGCAT CACAACCCGG CAATCCACTT 
AGAACTACAG ATGAAATGTT AAACGAGTTT 
ATTGTTGTGA AAAATACAAA CGAATTAGCA 
GATGAATTAT ACACACCGCG TATGGAAGGT 
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CTGCCTCAAA 


TCGTAATTGA TCGATTAGAA AAAGAATTAA AAAGTATTAT CGGTAATGGA 


73B0 




TTTGCGGTAA 


TTTACTTAAT 


TTCGCAACGT 


TTAGTTAAAA AATCATTAGA 


TGATGGATAC 


7440 


5 


TTAGTTGGTT 


CCCGTGGTTC 


AGTAGGTTCT 


AGTTTTGTAG 


GGACAATGAC 


TGAGATTACT 


7500 




GAAGTAAACC 


CGTTACCGCC 


ACACTATATT 


TGTCCGAACT 


GTAAAACGAG 


TGAATTTTTC 


7560 


10 


AATGATGGTT 


CAGTAGGATC 


AGGATTTGAT TTACCTGATA AGACGTGTGA AACTTGTGGA 


7620 


GCGCCACTTA 


TTAAAGAAGG 


ACAAGATATT 


CCGTTTGAAA 


CATTTTTAGG 


ATTTAAGGGA 


7680 




GATAAAGTTC CTGATATCGA CTTAAACTTT AGTGGTGAAT ATCAACCGAA TGCCCATAAC 


7740 


15 


TACACAAAAG 


TATTATTTGG 


TGAGGATAAA 


GTATTCCGTG 


CAGGTACAAT 


TGGTACTGTT 


7800 




GCTGAAAAGA 


CTGCTTTTGG 


TTATGTTAAA 


GGTTATTTGA 


ATGATCAAGG 


TATCCACAAA 


7B60 




AGAGGTGCTG 


AAATAGATCG 


ACTCGTTAAA 


GGATGTACAG 


GTGTTAAACG 


TACAACTGGA 


7920 


20 


CAGCATCCAG 


GGGGTATTAT 


TGTAGTACCT 


GATTACATGG 


ATATTTATGA 


TTTTACGCCG 


7980 




ATACAATATC 


CTGCCGATGA 


TCAAAATTCA 


GCATGGATGA 


CGACACATTT 


TGATTTCCAT 


8040 




TCTATTCATG 


ATAATGTATT 


AAAACTTGAT 


ATACTTGGAC 


ACGATGATCC 


AACAATGATT 


8X00 


25 


CGTATGCTTC 


AAGATTTATC 


AGGAATTGAT 


CCAAAAACAA 


TACCTGTAGA 


TGATAAAGAA 


8160 




GTTATGCAGA 


TATTTAGTAC 


ACCTGAAAGT 


TTGGGTGTTA 


CTGAAGATGA 


AATTTTATGT 


8220 




AAAACAGGTA 


CATTTGGGGT 


ACCAGAATTC 


GGTACAGGAT 


TCGTGCGTCA 


AATGTTAGAA 


8280 


30 


GATACAAAGC 


CAACAACATT 


TTCTGAATTA 


GTTCAAATCT 


CAGGATTATC 


TCATGGTACA 


8340 




GATGTGTGGT 


TAGGCAATGC 


TCAAGAATTA 


ATTAAAACCG 


GTATATGTGA 


TTTATCAAGT 


8400 


35 


GTAATTGGTT 


GTCGTGATGA 


TATCATGGTT 


TATTTAATGT 


ATGCTGGTTT 


AGAACCATCA 


8460 


ATGGCTTTTA AAATAATGGA 


GTCAGTACGT 


AAAGGTAAAG 


GTTTAACTGA 


AGAAATGATT 


8520 




GAAACGATGA AAGAAAATGA AGTGCCAGAT TGGTATTTAG ATTCATGTCT TAAAATTAAG 


8580 


40 


TACATGTTCC 


CTAAAGCCCA 


TGCAGCAGCA 


TACGTTTTAA 


TGGCAGTACG 


TATCGCATAT 


8640 


TTCAAAGTAC ATCATCCACT 


TTATTACTAT 


GCATCTTACT 


TTACAATTCG 


TGCGTCAGAC 


8700 




TTTGATTTAA 


TCACGATGAT 


TAAAGATAAA 


ACAAGCATTC 


GAAATACTGT 


AAAAGACATG 


8760 


45 


TATTCTCGCT 


ATATGGATCT 


AGGTAAAAAA 


GAAAAAGACG 


TATTAACAGT 


CTTGGAAATT 


8820 




ATGAATGAAA 


TGGCGCATCG 


AGGTTATCGA 


ATGCAACCGA 


TTAGTTTAGA 


AAAGAGTCAG 


8880 




GCGTTCGAAT 


TTATCATTGA 


AGGCGATACA 


CTTATTCCGC 


CGTTCATATC 


AGTGCCTGGG 


8940 


50 


CTTGGCGAAA 


ACGTTGCGAA 


ACGAATTGTT 


GAAGCTCGTG 


ACGATGGCCC 


ATTTTTATCA 


9000 




AAAGAAGATT 


TAAACAAAAA 


AGCTGGATTA 


TCTCAGAAAA 


TTATTGAGTA 


TTTAGATGAG 


9060 
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GAAATAATCA AGGTATTTAT TTAATGCGTA 
CTGGACACAA AATTATGCCC GTATTTCTTT 
5 TGGTGAAATA AAGGAACAAA CTTTTACAAG 

TCAAGCATAA ACTTATGCTA TAATTAAGTT 
GTGGGAGATT CCCGCTCTTT TCTATTTGCC 

10 

AGAACAAGTA GAAGTGATTG TTAAACCAAT 
CGTTGAATAT GTCAAAGAGG GTAGAGATCA 
TGGCGTAGAT TTAAATGATT GTACGCTAGC 

15 

AAATGATCCT ATTCCTGAAA TGTATTATTT 
AATTAAAAAA GAACAAGATT TCCAAAATGC 

2Q TGTACCAATT GAAGGTGAAA AGGAATGGTT 
AATTGTAGTA CAAGTTAAAA TCAAAGCAAG 
AATAGCAAAA GGACGTCACG CAGTTATGAT 

25 AGTAATGAAT TATTATTAGC TACTGAGTAT 
GTATTAATTG ATGCTATTGA AGCAGCTTTA 
GCAAGAAATG TCCGTGTGGA ATTAAATATG 

30 AAAGATGTTG TTGAAGAAGT ATTTGACGAC 
GTTAAAAACC CTGCATATGA AATTGGTGAT 
TTTGGTCGTG TAGGTGCTCA AGCAGCGAAA 

35 GAACGTGAAA TTTTATTTGA AGAATTTATA 
ATTGACCGTG TTGACCATCG TTATGTATAT 
TCTGAAGCAG AAAGAAGTCC TAACGAAAAA 

40 

GTTAACAAAG TGGAACAAAC GACAAAAGGT 
GGTTTATTAA AACGTTTATT TGAACAAGAA 
GTTAAATCAG TAGCACGTGA AGCTGGCGAT 

45 

AATGATATAG ATGCTGTTGG TGCATGTGTT 
GTTGAAGAGC TAGGTGGTGA AAAAATCGAC 
50 TTTGTAAAAA ATGCTTTAAG CCCTTCTCAA 
CAATCTACAG TAGTTGTTGT TCCTGATTAT 



TGGCGTAGTC AAAGAAATAC AAAATTGTTG 9180 

TCAATGTCTT ACGAGTCTAT TCAAATGTAA 9240 

AATCTCTGAT TAATAGTGAA GTCATTTGTT 9300 

GCTTAAAAAT TAGTGAACTC AGGCAGAAGA 9360 

AAAAAGGGAG GCCTGTATGA GTAAAATTAC 9420 

TATGGAAGAC TTGAATTTTG AACTTGTAGA 9480 

TTTTCTTAGA ATCTCTATTG ATAAAGAAGG 9540 

TTCTGAAAAA ATAAGTGAAG CTATGGATGC 9600 

AGACGTAGCG TCACCTGGTG CAGAACGTCC 9660 

AATAACTAAA CCTGTATTTG TTTCTTTATA 9720 

AGGCATTTTA CAAGAAGTCA ATAATGAAAC 9780 

AACGAAAGAT ATAGAGATAC CGAGAGACAA 9840 

TTAACGTGAT GAGGAGGAAA AAACGTGTCA 9900 

TTAGAAAAAG AAAAGAAGAT TCCTAGAGCA 9960 

ATTACTGCAT ACAAAAAGAA TTATGATAGT 10020 

GATCAAGGTA CTTTCAAAGT TATCGCTCGT 10080 

AGAGATGAAG TGGATTTAAG TACAGCGCTT 10140 

ATATACGAAG AAGATGTAAC ACCTAAAGAT 10200 

CAAGCAGTAA TGCAACGTCT TCGTGATGCT 10260 

GACAAAGAAG AAGACATACT TACTGGAATT 10320 

GTGAATTTAG GTCGTATCGA AGCTGTTTTA 10380 

TATATTCCTA ACGAACGTAT CAAAGTATAT 10440 

CCTCAAATCT ATGTTTCTCG TAGCCATCCA 10500 

GTTCCAGAAA TTTACGATGG TACTGTAATT 10560 

CGCTCTAAAA TTAGTGTCTT CTCTGAAAAC 10620 

GGTGCTAAAG GCGCACGTGT TGAAGCTGTT 10680 

ATCGTTCAAT GGAATGAAGA TCCAAAAGTA 1074 0 

GTTTTAGAAG TTATTGTTGA TGAAACAAAT 10800 

CAATTGTCAT TAGCGATTGG TAAAAGAGGA 10860 
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GATGCGCGTG AAGCGGGTAT CTATCCAGTA GTTGAAGCTG AAAAAGTAAC TGAAGAAGAT 10980 

GTTGCTTTAG AAGATGCTGA CACAACAGAA TCAACCGAAG AGGTAAATGA TGTTTCAGTT 11040 

5 GAAACAAATG TAGAGAAAGA ATCTGAATAA TAGGTTGGAG TGAAGTATCT ATGAAAAAGA 11100 

AAAAAATTCC GATGCGAAAA TGTATTCTTT CAAATGAAAT GCATCCCAAA AAAGATATGA 11160 

TTCGTGTTGT TGTTAATAAA GAAGGCGAAA TCTTTGCGGA TGTTACTGGA AAGAAACAAG 11220 

10 

GCCGTGGCGC ATATGTTTCT AAAGATGTTG CTATGGTTGA AAAAGCACAA CAAAAAGAAA 11280 

TTTTAGAAAA ATATTTTAAA GCATCTAAAG AGCAATTGGA TCCTGTTTAC AAAGAAATTA 11340 

TTAGATTAAT TTATAGAGAA GAGATCCCAA AATGAGTATA GATCAAATAT TAAACTTTTT 114 00 

15 

AGGATTAGCA ATGAGAGCTG GTAAAGTAAA AACAGGTGAA TCAGTCATTG TTAATGAGAT 11460 

TAAAAAAGGA AATTTGAAGC TCGTTATTGT TGCAAATGAT GCGTCTGATA ATACAGCTAA 11520 

ATTAATTACA GATAAATGTA AGAGTTACAA AGTTCCATTC AGAAAGTTTG GAAATCGAAA 11580 

20 

TGAATTGGGA ATAGCACTTG GAAAAGGTGA GCGTGTTAAT GTAGGGATTA CTGACCCAGG 11640 

CTTTGCTAAA AAGTTGCTAT CAATGATAGA TGAATATCAT AAGGAGTGAT TATATGAGTA 11700 

2S AACAAAGAAT TTACGAATAT GCGAAAGAAT TAAATCTAAA GAGTAAAGAG ATTATAGATG 11760 

AGTTAAAAAG CATGAATATT GAGGTTTCAA ATCATATGCA AGCTTTGGAA GATGACCAAA 11820 

TTAAAGCATT AGATAAAAAG TTCAAAAAAG AACAAAAGAA CGACAATAAA CAAAGCACTC 11880 

30 AAAATAATCA CCAAAAATCA AACAATCAAA ACCAAAATAA AGGGCmACAA AAAGATAACA 11940 

AAAAGAATCm ACAACAAAAT AATAAAGGCA ACAAAGGCAA TAAAAAGAAT AATAGAAATa 12000 

ATAAGAAAAA TAACAAGAAT AATAAACCAC AAAATCAACC AGCTGCTCCA AAAGAAATAC 12060 

35 CATCAAAAGT GACATATCAA GAAGGTATTA CAGTAGGCGA ATTTGCGGAT AAATTAAATG 12120 

TTGAATCATC AGAAATTATC AAAAAATTAT TCTTACTTGG TATTGTTGCT AATATCAATC 12180 

AATCATTAAA TCAAGAAACA ATCGAATTAA TTGCCGATGA TTATGGCGTT GAGGTTGAAG 12240 

40 

AAGAAGTTGT GATTAATGAA GAAGACTTAT CAATCTATTT CGAAGACGAA AAAGATGATC 12300 

CAGAGGCAAT TGAGAGACCA GCAGTTGTAA CAATTATGGG ACATGTTGAC CATGGTAAAA 12360 

CGACTTTATT AGATTCAATT CGTCATACAA AAGTTACAGC AGGTGAAGCA GGCGGAATCA 12420 

45 

CTCAACATAT TGGTGCATAT CAAATTGAAA ACGATGGCAA AAAAATCACT TTCTTAGATA 12480 

CACCGGGACA TGCTGCATTT ACAACGATGC GTGCGCGTGG TGCaCAAGTA ACAGATATTA 12540 

50 CTATTTTAGT AGTAGCAGCT GACGATGGTG TTATGCCACA AACAATTGAA GCAATTAACC 12600 

ATGCTAAAGA AGCAgAAGTA CCAATTATTG TTGCAGTAAA TAAAATTGAT AAACCAACTT 12660 
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10 



15 



20 



GCGGCGAAAC AATTtTCGTc CACTTTCTGC ATTAAGTGGT GATGGTATCG ACGATTTATT 12780 

AGAAATGATA GGATTAGTTG CAGAAGTTCA AGAACTTAAA GCAAATCCTA AAAACCGTGC 12840 

TGTTGGTACA GTTATCGAAG CTGAATTAGA TAAATCACGT GGTCCTTCTG CATCATTATT 12900 

AGTACAAAAC GGTACATTAA ATGTTGGTGA TGCGATTGTA GTTGGTAATA CTTACGGCCG 12960 

TATCCGTGCA ATGGTTAATG ACTTAGGTCA AAGAATCAAA ACGGCTGGTC CATCAACGCC 13020 

TGTTGAAATT ACAGGTATTA ATGATGTGCC ACAAGCTGGG GATCGCTTTG TTGTATTTAG 13080 

TGATGAAAAA CAAGCTCGTC GTATTGGTGA ATCAAGACAC GAAGCTAGCA TTATACAACA 1314 0 

ACGTCAAGAA AGTAAAAATG TTTCATTAGA TAACCTGTTT GAACAAATGA AACAAGGTGA 13200 

AATGAAAGAT TTAAACGTTA TTATTAAAGG TGATGTTCAA GGTTCTGTTG AAGCTTTAGC 13260 

TGCATCATTA ATGAAAATTG ATGTTGAAGG CGTAAATGTT CGTATCATTC ATACAGCGGT 13320 

TGGTGCAATT AATGAGTCAG ACGTGACACT TGCTAATGCC TCAAATGGTA TTATCATTGG 1338 0 

TTTCAATGTT CGTCCAGACA GTGGTGCAAA ACGTGCTGCA GAAGCTGAAA ATGTTGATAT 1344 0 

GCGTTTACAC AGAGTTATTT ATAATGTTAT CGAAGAAATT GAATCAGCGA TGAAAGGTTT 13500 

25 ACTTGATCCA GAATTTGAAG AACAAGTTAT CGGACAAGCT GAAGTTCGTC AAACATTCAA 13 560 

AGTTTCTAAA GTTGGTACTA TTGCTGGATG TTATGTTACT GAAGGTAAAA TTACGCGAAA 13620 

TGCTGGTGTA CGTATTATTC GTGATGGTAT TGTTCAATAT GAAGGCGAAT TAGATACACT 13 680 

30 TAAACGTTTC AAAGATGATG CTAAGGAAGT TGCAAAAGGT TATGAATGTG GTATTACAAy 13740 

TGAAAACTAC AATGACCTTA AAGAAGGCGA TGTTATCGAA GCATTTGAAA TGGTTGAAAT 13 800 

TAAGCGTTAA TTAAATAAAT TACAAGCTAA AAGTATAGTT AAGATTGATA TGCTCCCTAT 13 860 

AAATATTGCA CTTTTTAAGT GTCTACTTTA TAGGGAGCAT ATTTGATACT AGCTTTTGGT 13 920 

TTTTTATTAG AATAGATTAC CTATTAAAAG TTACGTTATA TGGACATGAT TTTGTATAAA 13 980 

ATTTTGTGGT • GGCCTAGAAT GATTTTTAAT GACAAAATAT AATGTCGACT ATTATTGGAA 14 040 

AATTTTCTGT TGaAATGCCT ATCTTACGGC AAACTTTATT TGATTTTATA GGCTTAATTT 14100 

ATTAAAATAA CGTGTGAGCT AAAATAATTG TTTAAGCATT GTTACACTAA AAAATGCAAA 14160 

TAACAATTGA ACTTAAAGAT AAAGAGGTGA CAAGAATGAG CAGTATGAGA GCAGAGCGTG 14220 

TTGGTGAACA AATGAAGAAG GAATTAATGG ATATCATCAA CAATAAAGTC AAAGATCCTC 14280 

GAGTTGGTTT TATTACAATT ACAGATGTTG TTTTAACAAA TGATTTATCG CAGGCTAAAG 14340 

TATTTTTAAC TGTATTAGGT AACGATAAAG AAGTAGAAAA TACATTTAAA GCACTTGATA 14400 

AAGCAAAAGG CTTCATTAAG TCTGAATTAG GTTCTAGAAT GCGATTACGT ATTATGCCGG 14460 
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AAGATTTACA CAAACAAGAT AGATAATTTA 
TTCTTAATAT CGGTATATTA ACATTAAACA 
5 CATTTTCCAG TTTTTTTATG AATAAATTTA 

AAGAAGGTGA CTATATGTAT AATGGGATAT 
GTCATGACGT TGTATTCAAA TTGCGTAAAA 

10 

GTACGCTTGA TCCCGAAGTT GCAGGCGTGT 
TTAGTGATTA TGTTATGGAT ATGGGCAAAG 
GTACAACGAC TGAAGATCAA ACGGGTGATA 

15 

ATTTTAATAA GGACGATATT GACCGATTGT 
TTCCGCCGAT GTACTCATCC GTCAAAGTAA 
ATAATGAAAC AGTTGAAAGA CCAAAGCGTA 

20 

CTGAATTAGA TTTTAAAGAA AATGAGTGTC 
GTACATATAT TAGAACGCTA GCAACTGATA 

25 TGTCGAAATT AACACGAATC GAGTCTGGTG 

AACAAATAAA AGAACTTCAT GAGCAGGATT 
ATGGATTAAA GGGTTTGCCA AGCATTAAAA 

30 TAAATGGGCA GAAATTTAAT AAAAATGAAT 

TTATTGATGA TGATTCAGAA AAAGTATTAG 
CAGAAATTAA ACCTAAAAAA GTCTTTAATT 
AGtGACACAT CCTATACAAT CTAAACAGTA 
ATTTTTCGAT GGCATGCATA AAGGTCATGA 
TGAGGCACGC AGTTTAAAAA AAGCGGTGAT 

40 

GAATCCTAAA AGAAAACGAA CAACGTATTT 
TAGCCAACAT GATATTGATT ATTGTATAGT 
GAGCGTAGAA GATTTTGTTG AAAATTATAT 

45 

TGGTTTTGAT TTTACTTTTG GTAAATTTGG 
TGATGCGTTT AATACGACAA TTGTGAGTAA 
5Q AACTTCTATT CGTCAAGATT TAATCAATGG 

CTATATATAT TCTATTAAAG kCACTGTAGT 

55 



GTGTTAGGTA TCTGGAAAAT GTTTGATAAT 14 580 

GTTAATACAT AGATGTGTAG AAATAGTTAA 1464 0 

GTTGATACGC TATTAAAATA TATTTTAAAA 14700 

TACCAGTATA TAAAGAGCGC GGTTTAACAA 14760 

TATTAAAAAC TAAAAAAATA GGTCACACGG 14 620 

TACCGGTATG TATAGGTAAT GCAACGAGAG 14 880 

CTTATGAAGC AACTGTATCG ATAGGAAGAA 14 94 0 

CATTGGAAAC AAAAGGTGTA CACTCAGCAG 15000 

TAGAAAGTTT TAAAGGTATC ATTGAACAAA 15060 

ATGGTAAAAA ATTATATGAA TATGCGCGTA 15120 

AAGTtAATAT TAAAGACATT GGGCGTATAT 15180 

ATTTTAAAAT ACGCGTCATC TGTGGTAAAG 15240 

TTGGTGTGAA ATTAGGCTTT CCGGCACATA 15300 

GATTTGTGTT GAAAGATAGC CTTACATTAG 15360 

CATTGCAAAA TAAATTGTTT CCTTTAGAAT 15420 

TTAAAGATTC GCACATAAAA AAACGTATTT 15480 

TTGATAACAA AATTAAAGAC CAAATTGTAT 15540 

CAATTTATAT GGTACACCCT ACAAAAGAAT 1560 0 

AAAGGAGATA GAATTTATGA AAGTCATAGA 15660 
TATTACAGAG GATGTTGCAA TGGCATTCGG . 1572 0 

CAAAGTCTTT GATATATTAA ACGAAATAGC 15780 

GACATTTGAT CCGCATCCGT CTGTCGTGTT 1584 0 

AACGCCACTT TCAGATAAAA TCGAAAAAAT 15900 

GGTTAATTTT TCATCTAGGT TTGCTAATGT 15960 

AATTAAAAAT AATGTAAAAG AAGTCATTGC 16020 

AAAAGGTAAT ATGACTGTAC TTCAAGAATA 16080 

ACAAGAAATT GAAAATGAAA AAATTTCTAC 1614 0 

TGAGTTGCAA AAAGCGAATG ATGCTTTAGG 16200 

GCAAGGTGAA AAAAGGGGAA GAACTATTGG 16260 



809 



EP0 786 519 A2 



TGCTGTTAGT ATTGAAATCG GCACTGAAAA TAAATTATAT CGAGGGGTAG CTAACATAGG 16380 

TGTAAAGCCA ACATTTCATG ATCCTAACAA AGCAGAAGTT GTCATCGAAG TGAATATCTT 16440 

5 

TGACTTTGAG GATAATATTT ATGGTGAACG AGTGACCGTG AATTGGCATC ATTTCTTACG 16500 

TCCTGAGATT AAATTTGATG GTATCGACCC ATTAGTTAAA CAAATGAACG ATGATAAATC 16 560 

GCGTGCTAAA TATTTATTAG CAGTTGATTT TGGTGATGAA GTAGCTTATA ATATCTAGAG 16620 

10 

TTGCGTATAG tTATATAAAC AATCTATACC ACACCTTTTT CTTAGTAGGT CGAATCTCCA 16680 

ACGCCTAACT CGGATTAAGG AGTATTCAAA CATTTTAAGG AGGAAATTGA TTATGGCAAT 16740 

15 TTCACAAGAA CGTAAAAACG AAATCATTAA AGAATACCGT GTACACGAAA CTGATACTGG 16800 

TTCACCAGAA GTACAAATCG CTGTACTTAC TGCAGAAATC AACGCaGTAA ACGAACACTT 16860 

ACGTACACAC AAAAAAGACC ACCATTCACG TCGTGGATTA TTAAAAATGG TAGGTCGTCG 16920 

20 TAGcATTTaT TAAACTACTT ACGTaGTAAA GATATTCAAC GTTACCGTGA ATTAATTAAA 16980 

TCACTTGGTA TCCGTCGTTA ATCTTAATAT AACGTCTTTG AGGTTGGGGC ATATTTATGT 17040 

TCCAACCTTA ATTTATATTA AAAAAGCTTT TTACAAATAT TAACATTTAT TATATGTTAA 17100 

25 GCTAATATTG AGTGAATAAT AAGGTTACAA TGAGATAAAG ATGATATAAG TACACCTAGA 17160 

GTAATAATCA AGATATTAAA AATAAAGTAT GTTTTTTTAA AAAATATAAC TTATATTTAT 17220 

ACTGATAAGG GTGGGACGAT AAGTCTATTT TGTAAATAAT AGATGGATAT CCCGCTCTCT 17280 

30 

TTTTTTCCAA TTCAATATTT TATAACTAAT ATTAAAATAC GATAATAAAT GATATGATAT 17340 

AACTATTAGA TTCAAGAGAG GAGATTTATA ATGTCTCAAG AAAAGAAAGT TTTTAAAACT 17400 

GAATGGGCAG GAAGATCTTT AACGATTGAA ACAGGGCAAT TAGCTAAACA AGCAAATGGC 17460 

35 

GCTGTATTGG TTCGTTATGG AGATACAGTC GTGTTATCGA CGGCAACTGC ATCAAAAGAA 17520 

CCTCGTGATG GAGATTTCTT CCCATTAACA GTGAACTATG AAGAAAAAAT GTACGCTGCG 17580 

GGTAAAATTC CTGGTGGATT TAAAAAGAGA GAAGGACGTC CTGGTGACGA TGCAACATTA 1764 0 

40 

ACTGCGCGAT TAATTGATAG ACCAATTAGA CCTTTATTCC CTAAAGGATA TAAGCATGAT 17700 

GTTCAAATTA TGAACATGGT ATTAAGTGCA GATCCTGATT GTTCACCACA AATGGCTGCA 17760 

45 ATGATTGGTT CATCTATGGC GCTTAGTGTG TCGGATATTC CATTCCAAGG GCCAATCGCC 17820 

GGTGTAAATG TGGGTTATAT TGACGGTAAA TATATCATTA ACCCAACAGT AGAAGAAAAA 17880 

GAAGTTTCTC GTTTAGACCT , TGAAGTAGCT GGTCATAAAG ATGCGGTAAA CATGGTAGAG 17940 

50 GCAGGCGCTA GTGAGATTAC TGAACAAGAA ATGTTAGAGG CGATTTTCTT TGGTCATGAA 18000 

GAGATTCAAC GTTTAGTTGA TTTCCAACAA CAAATCGTCG ACCACATTCA ACCTGTTAAA 18060 
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GAAGAAAAAG GACTTAAAGA AACAGTTTTA 
CTTGATAACT TAAAAGAAGA AATCGTCAAT 
5 GAaTTACTTA TTAAAGAAGT TTATGCAATT 

CGTTTAATTG CAGATGAAAA AATTAGACCA 
TTAGATTCTG AAGTTGGTAT TTTACCTAGA 

10 

CAGACTCAAG CACTTTCAGT TTTAACATTA 
GGTTTAGGAC CTGAAGAAGA AAAAAGATTC 

15 GTAGGTGAAA CTGGTCCAGT ACGTGCGCCA 

GGTGAAAGAG CATTAAAATA TATTATTCCT 
ATTGTAAGTG AGGTACTTGA ATCAAATGGT 

20 ACATTAGCAT TAATGGATGC GGGCGTACCG 

GGCCTTGTTA CACGTGAAGA TAGCTATACG 
GCATTAGGTG ATATGGACTT TAAAGTCGCT 

25 

ATGGATATTA AAATTGACGG TTTAACGCGT 
AGACGTGGTC GTTTAGAAAT AATGAATCAT 
GAATTAAGTG CTTACGCGCC AAAAGTTGTA 

30 

GATGTTATCG GACCTGGTQG TAAAAAAATT 
TTAGATATTG AACAAGATGG TACTATCTTT 
35 CGTGCTCGTG AAATCATTGA GGAAATTACA 

GCCACTGTTA AACGTATTGA AAAATACGGT 
GCGTTGCTTC ACATTTCACA AATTTCAAAA 

40 

AAAATCGGTG ACACAATTGA AGTTAAGATT 
GCTTCACATA GAGCATTAGA AGAATAATAT 
TGTGATTTTT TTATGCCACT TTTTACGAAG 

45 

TTTTAAAACG CTTTATTATT TTGTGTGCAA 
ATAGTGTACA TCAAGTGTTT TTTAACTTAT 
50 AACAAATTTA GGAGGTAAGA TTTTGAGTTT 

•TATACCATTA GGCGGTGTTG GCGAAATTGC 
TGAAATGTTT ATGTTAGATG CTGGACTTAT 

55 



ACATTTGATA AACAACAACG AGATGaAAAT 18180 

GAATTTATCG ATGAAGAAGA TCCAGAGAAT 18240 

TTAAATGAAT TAGTGAAAGA AGAAGTTCGA 18300 

GACGGCCGTA AACCTGATGA AATCCGTCCA 18360 

ACGCATGGTT CAGGTCTATT TACACGTGGT 18420 

GGTGCTTTAG GCGATTATCA ATTAATTGAT 18480 

ATGCATCATT ACAACTTCCC GAATTTTTCA 18540 

GGTCGTCGTG AAATTGGACA TGGTGCGTTA 18600 

GATACTGCTG ATTTCCCATA TACAATTCGT 18660 

TCATCATCTC AAGCGTCAAT TTGTGGATCA 18720 

ATTAAAGCAC CAGTTGCTGG TATTGCTATG 18780 

ATTTTAACTG ATATCCAAGG TATGGAAGAT 18840 

GGTACTAAAG AAGGTATTAC AGCAATCCAA 18900 

GAAATTATCG AAGAGGCTCT AGAACAAGCG 18960 

ATGTTACAAA CAATTGATCA ACCACGTACT 19020 

ACTATGACAA TTAAACCAGA TAAGATTAGA 19080 

AACGAAATTA TTGATGAAAC AGGTGTTAAA 1914 0 

ATTGGTGCTG TTGATCAAGC TATGATAAAT 19200 

CGTGAAGCGG AAGTAGGTCA AACTTATCAA 19260 

GCGTTTGTAG GCCTATTCCC AGGTAAAGAT 19320 

AATAGAATTG AAAAAGTGGA AGATGTATTA 19380 

ACTGAAATTG ATAAACAAGG TCGAGTAAAT 19440 

TTAAAGTCAT ATGACGACAA TGTATCGTCA 19500 

TGACCCGTTT TGAATTTGTT GTATTGAACA 19560 

CTGTTAATTA TCCTGTATGT ATAGTGATTA 19620 

AATGAATAGT GAGTTTATAT ATGGACGGGT 19680 

AATAAAGAAA AAGAATAAAG ATATTCGCAT 1974 0 

TAAAAATATG TATATCGTTG AAGTAGACGA 19800 

GTTTCCAGAA GACGAAATGC TAGGTATTGA 19860 
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CCTTACACAC 


GGACATGAGC ACGCGATTGG TGCAGTGAGT TATGTTTTAG 


AACAATTAGA 


i Anon 




TGCACCAGTA TATGGATCTA AATTGACAAT AGCGTTAATT AAAGAAAATA 


Tfi AAAG CCCd 


^UU4 0 


5 


TAATATTGAT AAAAAAGTTC GCTACTATAC AGTTAATAAT GATTCAATTA 


TGAGATTCAA 






AAACGTGAAT ATTAGTTTCT TTAATACGAC ACACAGTATT CCTGATAGTT 


X nuu X O 1 X lu 




10 


TATTCACACT 


TCATATGGTG CCATTGTGTA TACAGGTGAA TTTAAGTTTG 


ACCAAAGTTT 




ACATGGACAT 


TATGCACCAG ATATTAAACG TATGGCAGAG ATTGGTGAAG 


AAGGCGTATT 






TGTCTTAATC AGTGATTCTA CTGAGGCAGA GAAACCTGGA TATAATACTC 


CGGAAAATGT 


20 J40 


15 


GATTGAACAT 


CATATGTATG ATGCTTTTGC AAAAGTGCGA GGTCGCTTGA 


TAGTTTCATG 


20400 




TTATGCTTCG 


AACTTTATAC GTATTCAGCA AGTTTTAAAT ATTGCTAGCA AGCTAAATCG 


20460 




TAAAGTGTCA 


TTTTTAGGAA GATCACTTGA AAGTTCATTT AATATTGCTC 


GTAAAATGGG 


20520 


20 


GTATTTCGAC 


ATTCCTAAAG ATTTGCTAAT TCCTATAACA GAAGTTGATA 


ATTATCCTAA. 


20580 




AAATGAAGTG 


ATAATTATAG CTACTGGTAT GCAAGGAGAA CCTGTAGAAG 


CCTTAAGTCA 


20640 


25 


AATGGCGCAA 


CATAAGCATA AAATTATGAA TATCGAAGAA GGCGATTCTG ' TATTTTTAGC 


20700 


AATTACGGCT 


TCTGCTAATA TGGAAGTTAT CATTGCGAAT AcATTAAATG AGCtTgTtAC 


20760 




GnCTGGCGCA 


CATATTATTC CAAATAACAA AAAGATTCAT GCTTCAAGTC 


ATGGTTGCAT 


20820 


30 


GGAAGAATTA 


AAAATGATGA TTAATATTAT GAAACCTGAA TACTTTATTC 


CTGTACAAGG 


20880 




TGAATTTAAA ATGCAGATAG CACATGCGAA GCTAGCAGCT GAAGCAGGTG 


TTGCACCAGA 


20940 




AAAGATTTTC 


CTTGTGGAAA AAGGAGATGT CATTAATTAC AACGGTAAAG 


ATATGATATT 


21000 


35 


AAATGAAAAG 


GTAAATTCAG GAAATATTTT AATAGATGGC ATTGGTATTG 


GGGATGTAGG 


2 lOoU 




AAATATCGTG 


TTGAGAGACC GTCATCTTTT AGCAGAAGAT GGTATCTTTA 


TTGCTGTTGT 


01 i on 




AACGTTAGAT 


CCTAAAAATA GACGTATAGC TGCGGGACCT GAAATTCAAT 


CTCGTGGGTT 




40 


TGTATATGTA CGTGAAAGTG AAGACTTATT ACGTGAAGCA GAAGAGAAAG 


TACGTGAAAT 


4 ±Z*i U 




AGTAGAGGCT 


GGTTTACAAG AAAAACGCAT AGAATGGTCT GAAATTAAAC 


AAAATATGCG 


■51 -inn 


45 


TGATCAAATT 


AGTAAACTAT TATTCGAAAG TACAAAACGT CGTCCTATGA 


TTATTCCAGT 


^ JLjO u 




AATTTCTGAA 


ATTTAATCAA AAAGTCATTA ACATAAAAGA GGTGAGAACA AGTCACTGAA 


21420 




ATATAATGGT 


TGTCATGGAC AATTTACTTA TATTTTATGA TAGTCAATTG 


AAGGGGTAAC 


21480 


SO 


GATTAATCTG 


TTATCTTAAG TAAATTGATA CATAGATGAT ATTGTTCTAA 


CCTCTTTCAT 


21540 




CGTCTGTTTG GACTACATAT TCTAAACATC AAATAGGAAA TTATATATAA TAACGTCGTT 


21600 




TTAACTAAGG 


CAACATAAGG AGGTGCGTCA ATTGGCACAA GCAAAAAAGA 


AATCGACAGC 


21660 
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10 



15 



20 



25 



GATACGTTAT GTCATAGCTA TTTTAGTAGT TGTATTAATG GTGTTGGGTG TTTTCCAATT 21780 

AGGAATAATA GGTCGTCTAA TTGACAGCTT CTTTAATTAT TTATTTGGGT ACAGTAGATA 21840 

TTTAACATAT ATTTTAGTAC TCTTAGCAAC TGGTTTTATT ACATACTCTA AACGTATTCC 21900 

TAmaACTAGA CGAACGGCTG GTTCGATTGT ATTGCAAATT GCATTGCTAT TTGTATCACA 21960 

GTTAGTTTTT CATTTTAATA GTGGTATCAA AGCTGAAAGA GAACCTGTAC TTTCTTATGT 22020 

GTATCAGTCA TACCAACACA GTCATTTCCC AAATTTTGGT GGCGGTGTAT TAGGCTTTTA 22080 

TTTATTAGAG TTAAGCGTAC CTTTAATTTC ATTATTTGGT GTATGTATTA TTACTATTTT 22140 

ATTATTATGC TCAAGTGTTA TTTTATTAAC AAACCATCAA CATCGTGAAG TTGCAAAAGT 22200 

TGCACTGGAA AATATAAAAG CTTGGTTTGG TTCATTTAAT GAA 22243 
(2) INFORMATION FOR SEQ ID NO: 165: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5510 base pairs 

(B) TYPE: nucleic acid 
{C> STRANDEDNESS : double 
(D) TOPOLOGY: linear 



30 



35 



40 



45 



50 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 165: 

TTATTAATnA TTAATATTTT TATTTTTAAA AATAAAGCGA GGAGCTATCA ATGGAACAAA 60 

TTACTTCTGC ACAAAATAAT AGAATTAAAC AAGCGAACAA GCTAAAAmAG AAACGTGAGA 120 

GGGATAAAAC TGGATTAGCT TTAATTGAAG GTGTGCATTT AATTGAAGAA GCTTATCAAA 180 

GTGGAATTGT AATTACACAA TTATTTGCAA TTGAACCGGC AAGATTAGAT CAGCAAATTA 24 0 

WCGCATACGC GCAAGAAGTT TTTgAAATAA ACATGAAAGT TGCTGAATCT TTATCAGGTA 300 

CAGTGACACC ACAAGGGTTT TTCGCAATCA TTGAGAAGCC GCATTATGAT ATTTCTAAAG 360 

CACAACAAGT ATTGCTCATC GATCGTGTTC AAGATCCTGG AAATTTAGGC ACATTAATTA 420 

GAACTGCGGA TGCTGCTGGA ATGGATGCTG TAATAATGGA GAAGGGTACG ACAGATCCTT 4 80 

ATCAAGATAA AGTGTTGCGA GCGAGTCAAG GTAGTGTTTT CCATTTGCCA GTTATGACAC 540 

AAGATCTCGA TACGTTTATT ACTCAATTTA ATGGTCCTGT TTATGGTACA GCACTTGAAA 600 

ACGCAGTGgC ATACAAAGAA GTTACTTCAA GTGATTCTTT TGCATTACTA TTAGGTAATG 660 

AGGGAGAAGG TGTTAATCCT GAATTATTAG CACATACTAC ACAAAATTTA ATCATACCTA 720 

TTTATGGTAA AGCTGAAAGT TTAAATGTAG CGATTGCAGG TAGTATTTTA CTTTATCATT 780 

TGAAAGGTTG ACCGTGTTGA AAGTTTTCCG ATATAATTAT AATTAATTGT TTAACAGAAC 840 
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ATA A ATA ATT* 


Vjl ± 1 xAVjuVjA 


G AA1 AATCGT 


GACTGCAAGT 


TATTCCAATT 


ATTTAAAGTC 


960 




TTTTPA PP*T" P 


TTTfi/^TTS t "1* 
1 1 luui X/ll.1 


TAAAGAGATT 


TAAGTCGGAA 


AGACAATCCG 


TTATCAATAT 


1020 


5 


TAAACAAGTG 


TATGCTTAGG 


CATAAATTTG 


GGTGGTACCA 


CGGAAATGAC 


TTTCGTCCCT 


10BO 




TATTTTTTAA 


GAGGATGAAA 




AGTTAAACAA 


CAAATATGAT 


AAATAGAAAA 


1140 


10 


TGAATAGTTC 


GAATAGGGAG 


GTCAGTGACA 


TATGTCTGAA 


CAACAAACAA 


TGTCAGAGTT 


1200 


AAAACAACAA 


GCGCTTGTAG 


ATATTAATGA AGCAAATGAT 


GAACGTGCAC 


TGCAAGAAGT 


1260 




TAAAGTGAAA TACTTAGGTA AAAAAGGGTC AGTTAGCGGA CTAATGAAAT TGATGAAGGA 


1320 


15 


TTTGCCGAAT 


GAAGATAAAC 


CTGCGTTTGG 


TCAAAAAGTG 


AATGAATTGC 


GTCAAACAAT 


1380 




TCAAAATGAA TTAGATGAAA GACAACAGAT GTTAGTTAAA GAAAAATTAA ATAAGCcAAT 


1440 




TGGcTGAAGA 


AACAATTGAT 


GTATCATTAP. 


CAGGTPRTPA 


T atty: a A A TP 

XJ\X X unnn X V* 


njcwvc* a a app 


1500 


20 


ATCCATTAAC 


ACGTACAATA 


GAAGAAATTG 


AAfiAPTTATT 
^wj/w x x n x x 


PTTAflTSTTT A 




1560 




TTGTGAATGG 


ATATGAAGTT 


GAACAAGATC 


ATT AT AA PTT 


PfiAAATrtPTH 


A A r l"I"l'APPTA 


1620 




AATCACACCC 


TGCACGTGAT 


ATGCAAGATA 


GTTTCTATAT 


TAPGGATGAA 


ATTTTATTAP 

/\X X X XxlX 1AW 


1680 


25 


GTACGCATAC 


ATCACCAGTG 


CAGGCACGTa 


CGATGGAATC 


ACGTCATGGT 


CAAGGTPPAG 


1740 




TTAAAATTAT 


TTGCCCTGGT 


AAAGTGTATC 


GTCGTGACTC 


TGATGATGCG 


ACACATAGTC 


1800 


30 


ATCAATTTAC 


ACAAATCGAA 


GGATTAGTTG 


TTGATAAAAA 


CGTTAAAATG 


AGTGATTTGA 


1860 


AAGGTACTTT 


AGAATTGTTA 


GCTAAGAAAT 


TATTTGGTGC 


TGATCGTGAA 


ATTCGTTTAC 


1920 




GTCCAAGTTA 


CTTCCCATTC 


ACTGAACCTT 


CTGTAGAAGT 


TGATGTGTCA 


TGTTTTAAAT 


1980 


35 


GTAAAGGAAA 


AGGTTGTAAT 


GTGTGTAAAC 


ACACAGGATG 


GATTGAAATT 


TTAGGTGCTG 


2040 




GAATGGTACA 


TCCTAATGTA 


TTAGAAATGG 


CTGGTTTTGA 


TTCTTCAGAG 


TACTCTGGAT 


2100 




TTGCATTTGG 


TATGGGACCA 


GACCGTATTG 


CAATGTTGAA 


ATATGGTATA 


GAAGATATTC 


2160 


40 


GTCATTTCTA 


TACTAATGAT 


GTGAGATTTT 


TAGATCAATT 


TAAAGCGGTA 


GAAGATAGAG 


2220 




GTGACATGTA ATGTTGATAT 


CAAATGAATG 


GTTGAAAGAA 


TATGTAACAA 


TCGATGATTC 


2280 




TGTAAGTAAT 


TTGGCAGAAC 


GTATTACGCG 


CACAGGTATT 


GAAGTGGATG 


ATTTAATTGA 


2340 


45 


CTACACAAAA 


GATATCAAAA ATTTAGTTGT 


CGGCTTCGTT 


AAGTCAAAAG 


AGAAACATCC 


2400 




TGATGCTGAT 


AAATTAAATG 


TTTGCCAAGT 


TGATATCGGA 


GAAGACGAAC 


CTGTACAAAT 


• 2460 


50 


CGTTTGTGGT 


GCACCGAACG 


TTGaTGCAGG 


ACAATATGTC 


ATTGTTGCTA 


AAGTAGGTGG 


2520 


CAGATTGCCT 


GGTGGTATTA 


AAATTAAGCG 


TGCCAAATTA 


CGCGGTGAAC 


GTTCAGAAGG 


2580 




TATGATTTGT 


TCGTTACAAG 


AAATTGGTAT 


TTCAAGTAAC 


TATATACCGA 


AAAGTTTTGA 


2640 
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ATATTTAGAT GATCAAGTAA TGGAATTTGA TTTAACGCCG AATCGTGCAG ATGCTTTAAG 2760 

TATGATAGGT ACTGCTTATG AAGTTGCAGC ATTATATAAT ACAAAAATGA CTAAGCCAGA 2820 

5 GACAACATCA AATGAGCTTG ATTTATCTGC AAATGATGAA CTGACTGTGA CAATTGAAAA 2880 

TGAAGATAAA GTACGATATT ATAGTGCACG TGTTGTTCAC GACGTGACAA TTGAACCCTC 2940 

GCCAATTTGG ATGCAAGCAC GCTTAATAAA AGCGGGTATA CGTCCTATTA ATAATGTTGT 3000 

10 

TGACATTTCA AATTATGTGT TATTAGAATA CGGTCAACCA TTGCACATGT TTGATCAAGA 3060 

TGCGATTGGT TCACAACAAA TTGTTGTTCG TCAAGCTAAT GAAGGCGAAA AAATGACAAC 3120 

15 ATTAGATGAT ACAGAACGTG AATTATTAAC GAGCGATATT GTCATTACTA ATGGACAAAC 3180 

TCCAATTGCA TTAGCTGGTG TTATGGGTGG CGATTTTTCA GAAGTTAAAG AACAAACATC 3240 

AAATATAGTG ATTGAAGGTG CTATTTTTGA TCCAGTTTCA ATTCGTCATA CATCAAGACG 3300 

20 TTTAAATTTA CGCAGTGAAT CATCTAGTCG TTTTGAAAAA GGAATAGCTA CTGAATTTGT 3360 

AGATGAAGCA GTCGACCGTG CATGTTATTT ATTACAAACT TATGCAAACG GAAAAGTGCT 3420 

AAAAGATAGA GTGTCTTCAG GAGAACTTGG TGCATTTATT ACACCAATCG ACATCACTGC 34 80 

25 

TGATAAAATT AATCGCACTA TTGGATTTGA TTTGTCACAA AATGATATTG TTACTATTTT 3540 

TAATCAACTA GGGTTTGATA CAGAAATAAA TGATGATGTT ATTACAGTGC TAGTACCATC 3600 

ACGTCGTAAA GATATTACAA TTAAAGAAGA TTTAATTGAA GAAGTTGCAC GTATATATGG 3660 

30 

ATACGACGAT ATTCCATCAA CGTTACCTGT CTTCGATAAA GTTACTAGTG GTCAGCTAAC 3720 

TGATCGCCAA TATAAAACTA GAATGGTTAA AGAAGTGTTA GAAGGTGCTG GATTAGACCa 3780 

3$ AGCTATTACG TATTCGTTAG TTTCTAAAGA AGATGCTACT GCaTTTTCGA TGCAACAGCG 3 840 

TCAAACAATT GATTTATTGA TGCCAATGAG TGAAGCGCAT GCGTCATTAC GTCAAAGTTT 3900 

ATT&CCACAT TTAATCGAAG CGGCATCATA TAATGTGGCA CGCAAAAATA AAGATGTAAA 3960 

40 ATTATTTGAA ATCGGCAATG TCTTCTTTGC TAATGGAGAA GGTGAACTAC CAGATCAAGT 4020 

TGAATATTTA AGTGGTATTT TAACTGGAGA TTATGTAGTC AATCAATGGC AAGGTAAGAA 4 080 

AGAAACGGTT GATTTCTATT TAGCAAAAGG TGTCGTGGAT CGAGTATCTG AAAAGTTAAA 414 0 

45 

TCTTGAATTT AGTTATCGCC GTGCTGATAT TGaTGGATTA CATCCAGGTC GTACTGCTGA 4200 

AATCTTATTA GAGAATAAAG TTGTTGGTTT TATTGGTGAA TTACATCCAA TATTAGCAGC 4260 

TGATAATGAT TTAAAACGTA CGTATGTTTT TGAGTTGAAT TTTGATGCAT TAATGGCTGT 4320 

50 

GTCGGTAGGT TACATTAATT ACCAGCCAAT TCCGAGATTC CCAGGCATGT CTCGTGACAT 4380 

TGCATTAGAA GTAGATCAAA ATATTCCAGC AGCTGATTTA TTATCAACGA TTCATGCACA 4440 

55 
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5 



10 



15 



25 



30 



AAAAGGTAAA AiaTraaTTrt 


CAATACGTTT 


AAATTATTTA 


GACACAGAAG 


AAACATTGAC 


4560 


AGATGAGCGC GTTTPAAAAf": 


TACAAGCGGA 


AATTGAAGCA 


GCATTAATTG 


AACAAGGTGC 


4620 




AACCCCATGT ATAAGGATAT 


CTGAAGTAGA 


TTGATATL CC 


4680 


TAACATGGGG TTTTATTTTT 


GGGTTCACCA 


ATTTGGTTCC 


AATGCATTTA 


» « * TV z"' /"^ tv * T\ 

AAAAGTCAAA 


4740 


GAGGAACAGC GfiAATAPARA 


TGATGcTTCG 


CACAACTGCA 


TAAAAG CCTC 


fP IV JV TV IV 'T"P IV IV 

TAATGATTAA 


4800 


AAAT CAAACi A fWTITAAftA 


TTTTTTGGGC 


TTTTTCACGA 


TTTTTAAAAT 


GCTTTTTTGA 


4860 


A ATYiT^TATfT lilillor'Tr'Ahft 
An X vjvj 1 /A 1. ^ J. nnnv>jJ>unMA 


GACCGTATTT 


TTTTATAATT 


TTGGCGGCGA 


TTACATCGAC 


4920 


1 1 lAuLALtu uLALLl 1 lAu 


GAATCGTCAT 


ATTAATATTT 


TTTGATATTT 


GATCCATATA 


4980 




AAATTATGCT 


TGCCACTGCA 


ATGGCTAATG 


ACTTCGATTC 


5040 


TCCTTTTGTT TCAAATTTTG 


TTTTCTTTGG 


AAGTGGTATA 


TCTGATAATG 


CGTAATGGCT 


5100 


A I ALAL 11 L\i CGTTTTGCGA 


ACTGATCAAT 


GACGATATAG 


TCTAATTGAG 


ACGAATCAAT 


5160 


X 1 1 1 1 <->\Ml3 1 AUfVJ. T iT-Tl GA 


TGGCTTCATT 


ATGAAGGGCA 


GCTTTCATTT 


TTACTTGAGT 


5220 


CCAGCCTTTT GCTTGCTGAA 


TATTATATTT 


TTCATTGTGT 


AGTGTTAATA 


ATGAATGTGG 


5260 


TATGAAAGTA ACCAATTGCT 


CAGCAAGTTC 


TACAATTTTG 


GTATCGGTTA 


ATTTTTTTGA 


5340 


ATCATCTACA CCCAAAGTTT 


TTAAAATAGG 


GACATGCTCT 


TTGGTAACGA 


AAGCAGCACA 


5400 


CACAGTCAAC GGACCAAAGT 


AATCGCCACT 


TCCAGCCTCA 


TCACTACCAA 


TACAGTTAAA 


5460 


TTGrTCATAC ATTAaAGTTg 


TcCAgAAAAG AATTAGCCAT 


ATTTnCCTTT 




5510 



(2) INFORMATION FOR SEQ ID NO: 166: 

<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 9623 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
r (D) TOPOLOGY: linear 

40 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 166: 



45 



50 



GnTTATACTT ATAAATTTTA 


CGGGGGTAAT 


ATAATACTtA 


TTTACCTGTA ATATATGATA 


60 


ATTCTTCAGC GGCAGCTGCG 


TTGATAGTTC 


TATGAGAAAT 


GATACCTAAT 


CCTTTAACAT 


120 


TGGATTCTGA AATAACGATA 


GAACCATCAC 


TGTTAACTTT 


TTCAACAAAT 


GCTACATGAC 


180 


CGTAATGTTG ATCTGCACCA 


AATTGTCCAG 


CCTCAAATAC 


AACAGCAGCA 


TGACGTTTTG 


240 


GTGTATGACT TACTTGATAA 


TCACGGTATT 


GAGCTCGATT 


ATTCCAATTA 


TGTGCATCAC 


300 


CTAAATCACC TGAGATAGAT 


GTACCAAATT 


GTTTCATACG 


GTTATATACG 


TACCAAGTAC 


360 



55 
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ATGAATCATC ATAATCCTTG ATAGAACGTT 
CGTCAAACTG AGTTAATTGA TAGTGTTTAA 
5 GATCTGTAGC ATATGTTTTA GATAAGTGTG 

ATTTCCATGT TGGTTTATAA ATTGTTCGAT 
AGTAATCTTT TAGTGATTCT TTCGTGCTTG 

10 

ACAATTGATT ACCATCAGCT TCTAATGTGT 
CTTTGATACC GAATAAATTA TGGTTTGGTG 

1$ ATTCTAAGAT TGCTTGGGCA ATCATGACAG 

GATGTGCATC TTTAGCAATT GATTTGACAA 
TAAATTGTCC GCTATCATCA TTGTTAGATA 

20 CACGTGTATC CTTTTGATTA ACATCGTTAT 

TCAATTCATC TTGTGTTGGT AACTGTGGAT 
TTTTAGATTG AGATGCATAA TCTTTTTGTG 

25 AAATAGAGTC TAAAGCCGAA TCTGACATTG 

TTGCTTTATC GTCACTTGCT GGTTGACTAT 
AATTTGGTTG CTTATTAGAT GTACTTGGTT 

30 

TGTCTGCTTT ATCTTGTTTA GATGATTGCG 
TGTTTTTATT CGAATCATTT GTTGACTTTT 

3$ TATCCGAATT TAAATTGAAT AAGTTTTGGA 

ATTTATTTTT GGTTAGCAAT TGGTTTATAT 
CAATffiATATT GTTAGAGTCT GAAGTGCTGT 

40 TGTCTTGGTT ACTTGTATTA TTTTTGTCTG 

TAGAAGTTTC ATCGTCATTA GATTTTTTTG 

CTTTTTGAGG TGTATCAGCA TAAGCGgTAG 

45 

TTGATAGCAA ATAAATTAAA ATTTTATTTT 

TATAATAATT AAGTGTGATA ATAAACTATG 

AGTTGATAGG TATCAATCGA CTAAATATCT 

50 

GCAAAAATAA ATTAATTTAC AAAAAATATA 
TGTGACAATG AAGAACGCAT TTAAATTATT 
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CATATTTATC TAAATCTGGC ATGCGTTCAT 480 

TAATACTGTT TAATTTCTTA GCATAGTTTG 540 

ATGTTGCATC TTTATAAGAA TCGGCTTCCG 600 

TGCCATCAAT ACCATTTTTA ATAAGGTCAG 660 

GATATTTTCG GAATCCAGCA TTAATACTAT 720 

TAAAAGGAAC AGAATTCCCT TCaAAAGCAC 780 

ACwTAGCTAA AGCACTACGA CCTGAGTCAG 840 

ACGCATAAAT ATCGTTATCT TGACCAATGC 900 

ATTGACGTGT ATCTTTTGAG TCAACAACGT 960 

TACTAGGATC TGTTTCGAAT AATGATGTTG 1020 

TGAATGATTG AGCAGGTTTA GATTTATGTT 1080 

TCTTTGTATT AGATTTTTCA TTTTTGTCTT 1140 

TTTTCTTTGC ATCTTCACTG TATTGATCCA 1200 

ATTGATTATC TTTCGATGAA GATTTTTGAT 1260 

TTGATTGATT AGGTTGTGTT GGCTTTGGCG 1320 

TTGTATTGTT TGATTTAGGT GCTTTTTGAT 1380 

TATCAGTGTC ATTTTTGATG CTATTGTCAC 1440 

CGCCATTACG AGGTTGTTCG TAATCAGAAA 1500 

TTAAAGTTGT TAATGAGTAA TTATCATCGT 1560 

TGGTTTGTGG TAAATTCTTA TAAATAAAAT 1620 

CGTCTATAGT TTTAAATTTT TTGTCGTTAT 1680 

CTTTATCAAT ATCTTTACTT GTAGTATCCT 1740 

AATCATGAGA TGTTGTCTTA GCTGTAGTAT 1B0O 

GTGAAaCTAA AGTAGGTAAT ACGAGCGTAG 1860 

TAGGCATATT TCGTATTCTC CCTTGAAAAA 1920 

ATTTGTTATA ATXTATCGTA TGCTGAAAAT 1980 

TCCAGTAAAT TGATTATACT AATTCACAAC 2040 

TAAAAAATAT GAATAATTCC TACATAGGAG 2100 

TAAAATGGAT GTGAAGAAAG TAGCTAAGAC 2160 
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TAACTTATGG GCAATGTGGG ATCCATATGG CAACACGGGA CACATCAAGG TCGCAGTCGT 2280 

TAATGAAGAT AAAGGCGACA CAATCAGAGG GAAAAAAGTT AATGTCGGTA ATACGATGGT 2340 

TAATACACTC AAGAAAAATA AAAGTTTTGA TTGGCAGTTT GTAAGTAGAG AGAAAGCTGA 2400 

TCATGAGATA AAAATGGGTA AATATTTTGC AGGTATTTAC ATCCCATCTA AGTTTACACA 2460 

TGAAATTACA GGGACACTAC GTAAGCAGCC TCAAAAAGCA GATGTAGAAT TTAAGGTGAA 2520 

TCAGAAGATT AACGCTGTTG CGTCTAAGCT AACAGATACT GGTTCGTCAG TTGTCGTTGA 2580 

AAAAGCGAAT GAACAATTTA ATAAAACAGT AACTCGAGCA TTATTAGAAG AAGCTAACAA 2640 

AGCAGGTTTA ACTATTGAAG AAAATGTGCC GACAATTAAC AAGATAAAAA ATGCGGTATA 2700 

TTCAGCAGAT AAAGCTTTAC CTAAGATTAA TGACTTTGCG AATAAAATTG TATATTTGAA 2760 

TAACCACCAA GCGGATTTAG ATAAATATGC CAATGATTTT AGAAAACTAG GAAATTATAA 2820 

20 AGGTGATATT TTAGATGCTC AGAAAAAATT AAACGAaGTC AATGGTGCTA TTCCGCAACT 2880 

TAATGAAAAG GCTAAGTTGA TATTAGCTTT AAATAATTAT ATGCCGAAAA TTGAAAAAGC 2940 

GTTAAATTTT GCAGCTGATG ACGTGCCAGC GCAGTTCCCT AAAATTAATC AAGGACTTAA 3000 

CATTGCGAGT CAAGGTATTG ATCAAGCTAA TGGACAGTTA AATGATGCCA AAGGCTTCGT 3 060 

CACACAAGTT AGAAGTAGAG TCGGTGATTA TCAAGATGCA ATTCGACGCG CGCAAGATTT 3120 

AAATCGAAGA AACCAGCAAC AGATTCCTCA AAATAGCGCG GCGAACAACG AAACATCAAA 3180 

TAGTGCACCT GCAGCTGGTA ATGGTGTAGC ATCAACGCCA CCAAGTGCAC CAAGTGGCGA 324 0 

TACTGCACCA AATAATAATG TTACGCAAAA TACCGCACCA AATAGTAATA ATGCGCCTGT 3300 

ATCGACTACA CCACAAAGTA CAAGCGGGAA AAAAGATGGT CAAAGTTTTG TAGATATAAC 3360 

AACAACACAA GTCAGCACAG CTAACGAGAA CACACAAAAC ATTACAGATA AAGATGTTAA 3420 

ATCAtfTGGAA GCGGCATTAA CGGGCTCTTT ATTATCATTA TCAAATAATT TAGATACCCA 34 80 

40 AGCGAAAGCC GCACAAAAAG ATAGTCAGGC ATTACGTAAT ATTTCGTATG GGATTTTAGC 354 0 

ATCGGACAAG CCTTCTGATT TTAGAGAGTC TTTAGATAAT GTTAAGTCCG GTTTAGAATA 3600 

CACAACGCAA TATAATCAAC AATTTATCGA TACATTAAAA GAGATTGAGA AGAATGAAAA 3660 

TGTTGATTTA TCAAAAGAAA TTGATAAGGT AAAAGCAGCT AATAATCGAA TTAATGAATC 3720 

ATTAAGGTTA GTTAATCAAT TAAGCAATGC ATTAAAGAAT GGTAGTTCAG GAACTGCTGA 3780 

AGCTACTAAA TTACTAGATC AACTTTCAAA ACTAGATTCA TCATTATCAT CATTTAGAGA 3840 

TTATGTTAAA AAAGATCTTA ACAGCTCTTT AGTATCAATA TCACAACGTA TTATGGATGA 3900 

ATTGAACAAA GGGCAAACTG CATTATCCAA TGTTCAGTCT AAATTAAATA CAATTGATCA 3960 
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AACAGTATTA CCAAGTATTG AACAACAATA CATTAGTGCT GTTAAAAATG CTCAAGCAAA 4080 

CTTCTCGAAA GTGAAAAGTG ATGTAGcTAA AGCTGCTAAC TTTGTGCGCA ATGACTTACC 4140 

5 

ACAGTTAGAA CAGCGATTAA CTAATGCGAC AGCAAGTGTG AATAAAAATT TACCAACGTT 4200 

ATTAAATGGT TATGATCAAG CGGTAGGATT ACTAAATAAA AATCAGCCAC AAGCGAAAAA 4260 

GGCTTTATCA GATTTAGCTG ATTTTTCTCA AAATAAATTG CCTGATGTTG AAAAAGATTT 4320 

10 

GAAAAAAGCG AATAAAATTT TCAAGAAATT AGACAAAGAT GATGCAGTCG ACAAATTAAT 4380 

CGACACACTT AAGAATGATT TGAAAAAGCA AGCGGGTATT ATTGCAAATC CTATTAATAA 4440 

J5 GAAGACTGTT GATGTTTTCC CAGTTAAGGA TTATGGTTCA GGTATGACAC CATTCTATAC 4500 

TGCACTGTCA GTATGGGTAG GTGCACTCTT GATGGTAAGT TTATTAACGG TTGATAATAA 4560 

ACATAAGAGT CTAGAGTCAG TCTTAACGAC AAGACAAGTG TTCTTAGGTA AGGCAGGATT 4620 

20 CTTTATAATG CTTGGTATGT TGCAAGCACT CATTGTATCG GTTGGAGATT TGTTAATCCT 4680 

AAAAGCAGGA GTTGAGTCAC CTGTATTATT TGTACTTATA ACGATTTTCT GTTCGATTAT 4740 

TTTCAACTCA ATCGTATATA CGTGCGTATC ATTACTTGGT AACCCAGGTA AAGCCATTGC 4800 

25 

AATCGTATTG CTTGTATTAC AAATTGCAGG TGGTGGGGGA ACATTCCCAA TTCAAACTAC 4860 

GCCACAATTT TTCCAAAACA TTTCGCCATA CTTACCATTT ACGTATGCAA TTGATTCATT 4920 

ACGTGAAACA GTAGGCGGTA TTGTTCCGGA AATCCTAATT ACAAAATTAA TTATATTAAC 4 980 

30 

GTTATTTGGT ATAGGATTCT TCGTTGTAGG TTTAATTTTA AAACCTGTAA CAGATCCATT 5040 

GATGAAGCGC GTATCTGAAA AAGTTGACCA AAGTAACGTT ACAGAATAAA AATTAAATCC 5100 

35 ACACATTAGG GTTATAGCTC CTTAATGTGT GGATTTTTAT GTTTTTAGAC AGAAGAGATA 5160 

GTAATTTCTG TCTTTTATGG GACGGTTGTT ATCATTGCTA TTATCCAGGA TGACTTACTA 5220 

TAGC5ACTAAT ATTACCGACA AAGTGAATAT CCTCGTCTTC CGTAGTTAAA ATAAAGCTAG 5280 

40 AACCTTTTTG GATGTCATAG TGCTTATCGT TTACTGTTAA AGTACCAGTA CCATCGATAA 5340 

TTGTAACTAA GCAATAAGCA TGTGGTTTAT TGAATTTTAA ATCTCCATGA ATATCCCATT 5400 

TATATACTGC AAAATATTGA TTATCTACAA ATTGAGTTAC AGTGTGTGTG TCGATGTGAG 5460 

45 

TTGTTATAGG AGTAGTATTT GGTTCATGAT TGCCTAATTC AATCACATCT TTACTTTGCT 5520 

CTAAGTGCAA ATCACGCAAT TGACCATTTT GATCTCGTCT ATCATAGTCA TAAATACGGT 5580 

sq ATGTCGTATC GGAGGATTGT TGTGTCTCTA AAATTAAAAT ACCCGAACCA ATGGCATGGA 5640 

CAGTGCCAGC AGGAACATAA TAAAAGTCAC CGGGCTTAAC AGGTATACGT TTGAAAAGAC 5700 

TGTCAAATTC ATGATTATCA ATCATGTCTA TTAACGTCTG TTTATTATGT GCATGTACGC 5760 
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GTTCGCCTTC GTGTTTTAAA GCGTAGTCAT CATCTGGGTG AACTTGAACA GATAATTTAT 5880 

CATTGGCATC TAATACTTTA GTTAGCAGAG GGAAACTATC TCGTGAATCA TTATCGAATA 5940 

ATTCACGATG TTGTGACCAA AGTTGATCTA GGGTCATATC CTTGTATGGA CCATTGATAA 6000 

TTGTATTAGG ACCATTTGGA TGTGCAGAAA TTGCCCAGCA TTCACCAGTT GTTTCATTAG 6060 

GG AT ATCATA GTTAAATGCT TTTAATGCAT GACCGCCCCA AATTCTGTCT TTAAAAACGG 6120 

GTTGTAAAAA TAATGCCATA GTTAAAACTC CTCTATATTT TCATTAATAA GTTATAAATT 6180 

TCTGTAGTAC TGTTTGCATT AATTAGTGAT TGGCGTGTCT CATCATTCAT TAACGCTTTA 6240 

GATAAGCGCT GAAGTATTTT TAAATGTGTA TCCTGACTGT TGTTTGGTAC GGCAATTAAG 6300 

AATATCAATT GAGGTAGACT ACCATCTAGA CTGTCCCATT TAACACCATG ATTATTTTTC 6360 

ATAACAGCTA CAATCGGTTG TTTTACAACA TCAGACTTTG CATGTGGAAT GGCCACGTTC 6420 

20 ATGCCAATAG CTGTCGTAGm tCcATTTCAC GTTCTAGTAT TGCATTTTTT AAATGCGATG 64 80 

TGTGCTCTAC ATAACGGCAA ATTTTAAGTT TATGAATCAA CATATCAATT GCTTCGTTTC 654 0 

GAGACATGTC GTGATCAGTA ATTATCATAG TTTGTTGATC AAAAACATGA GAAGGTTTAT 6600 

TGAGATGTGA ATGTTTCGCG GTGTTATCTA CATTGTCAAC CTCTGTATCA TGTTGTGTAA 6660 

TATCTGTATC ATGAAGTTGC GTGTGTTGCG CTGGTGCATC TACTGCTATA ACTGGTGTAT 6720 

TGCGTTTTAA TAATAGTACA GTAGTCATTG TGACAAGACT ACCTACTATC ACTGCAAAGA 67 80 

TAAACCATAA TACATGATCA ATACCACCTA ATACAGCCAC GATTGGACCT CCATGTGCGA 684 0 

CTCTATCGCC GACACCACCA ATGGCTGCAA TGACTGATGC AATCATTGCA CCAATGATGT 6900 

TTGCAGGTAT AATGCGCAAT GGATCTTGGG CTGCGAAAGG AATAGCACCT TCAGTAATAC 6960 

CAAATAGTCC CATAGTGAAG GAAGCCTTAC CCATTTCTCT TTCGGAATGA TTGAATTTAT 7020 

ACTTTTGAAC AAACGTTGCT AAACCTAAAC CGATTGGTGG TGTACATACA GCAACTGCGA 7080 

40 CCATACCCAT AACGGCGTAA TTACCTTCAG CAATAAGTGC TGAGCCAAAT AAAAATGCTA 7140 

CCTTGTTTAC TGGACCGCCC ATATCGAAGG CAATCATCGC ACCTATAATC ATCGCAAGTA 7200 

TAATAATATT AGCACCTTGC ATACTTTTTA ACCAGGTTGT TAATGCCTCA AAAATATTAG 7260 

AAATTGGTGC ACCGATTAAA AATATAAATA TCAATCCTAC AACGACCGAT GAAATAATGG 7320 

GAATAATAAT GATAGGCATA ATTGGTGCCA TTGCTTTTGG AACTTTAATA TCTTTAATCC 7380 

ACTTTGCGAT ATAACCTGCT AAGAAACCAG CAACAATACC ACCTAAAAAT CCTGCGCCTG 7440 

CATCACTGCC ATAAAAACTA CCGTCAGCAG CGATAGCGCC GCCAATCATA CCAGGAACAA 7500 

GACCGGGcTT GTCAGCGATA CTAACAGCGA TATATCCAGC TAGTATTGGA ACCATAAATT 7560 
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70 



ATCCTTTTGA TGTCGTTtCA CCGCCTAGAG TCAGCGCGAT GGCGATAAGG AGTCCACCAA 7680 

CTACGATAAA AGGAACCATA AACGATACAC CGTTCATTAA ATGTTGATAC ACCATTTGAA 774 0 

TACCATTTTT AGACTTACCG CGATCTTTCG AATGATAATT TGTTTCAGAT TGATAAATAG 7800 

GCGCATCTTG ATTAATGATA CGTTGAATTA GACCTCTCGG ATTATGAATC CCTTCGCGAA 7860 

CATTTTCATT AATCAACCGT TTACCAACAA ATCGGGACAG ATCAACTTGT TTATCAGCTG 7920 

CAATTATGAC ACCGTCAGCT TCTTCGATGT CTTGCGTAGT TAAAACATTT TCAGCACCAA . 7980 

, CACCGCCCTG TGTCTCTACT TTAATATCCA CACCCATTTC TTTTGCTACC TGCTCAAGCT 8040 

15 TTTCTTGAGC CATATATGTA TGTGCAATGC CATTTGGGCA TGAGGTAATA GCTACAATTT 8100 

TCATAAAATC ATCTCCTTTT CTATATTGTA AGCGTATTCT CGATACTAAA AAAAAGAATA 8160 

ATTACCGTTA CTAGTGGCAA TTATTCTTGT AAGTATTCAA ATAACTGTTG CTTTAAACTA 8220 

20 TGATCATCTA AACTACATAA ATGGTTCACT GAATCATCAT CCAAGTTAGC AATTAATTGC 8280 

ATCATTTGTT TTGTAAAAGC TTTGTCTTTA TGCGAAATCG CTAAGAAAAA GACAAGTTTG 8340 

ACATCGTGTT GTCGCCAAGG AAAAACATCT TTTGTGCGAA AAATAAGCAC ATGTGATTGT 8400 

AAAACTTTTT CAGGATCTCC ATGAGGAATC GCCATAAAAT TACCTATGTA TGTAGAAGAT 8460 

GATTTCTCAC GCTCTAAAGC TGATTCGATA TATCCTTCTA CAATCGCATG ATGTGCTTGT 8520 

AATATTTTTT GAGCTTCTTC AAAAATTTGC ACAGTATGCC GTGATTTTTG TTCAGTATTT 8580 

ACGACAAGGA AATTGACAGT GTCCATATGA TGATGTGCTT GAACCGGATT TTGCTTTTGC 864 0 

TTCACAACGT GTCTGATTTT GTGACGATCA TCTTCAGAAA ATAATGGTGC AACCTTGATA 8700 

GTCGTCAGGT GCTTAGGAAG TATGTTTAGC GTTTGTTTAG GAATATCATG GGTCGTTATT 8760 

AATAAATCTA CATTGTCAAA GTGATAGTGT GTTATATTTT CTAGTTTAAT CGTATTTATC 8820 

ACTGACAACT CTTCGGATAA GTTATTTATT TTAGTTTCTA AAAAATTCGA CACACCTAGA 8880 

40 CCATAATAAC AAGCAATGAC TACATTTAAT TGTGTTTTGG TACGACGCTC GATGGCAGCT 8940 

TGAAAATGAA TTGTTAAAAA TGCAATTTCA TCTTCGCTCA TCTCTATATC AGTATCAATT 9000 

GCTAATTTAT GAATCGCTTC AAAAAGTGTG TTAAACACAA AGGGATAGAG TTTTTTAATC 9060 

TCTATAACTA AAGGATTGTT TAAATAAATG TTTTGAGTGA TACGTAAATA TGCTTTACTA 9120 

AAATGATTAT ATAAATTTTG TTGTAAAATC GAATCTTCAT TGAAAGGTAC ATGAATACGT 9180 

TGCTGCATCA ATTCGATTAA GCGATCAATA TAACTTTGTA TAAATATACG TTCTATGCCA 924 0 

ATATCGAGTT TATTAAAATG ATAAGCAATA AAGAATGAAA ACATATTGAT TACTTTTTCG 9300 

TTCAAGTCAT AACCTAATCT TTCGTTGATT TGCTTAATGC AAGATTGAGA TATCAATTTT 9360 
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AGATGAATTA AAAGCTGTTG TATTTGAATA TCAGTTGTTT CAATACTATG TTGTTGAAGT 9480 

GTCTCTTGTA TAATATGCGA AATCATCCTT TGGTGTGAAT CAGGTAATTC aTTTAAAATT 9540 

AGGTCTTCAA CATGTACATG CCCTGATGAT AATTGATTTA AATGGATGAT GGCATTAGTG 9600 

ATATCATTAT CTGTTCCATC GAC 9623 
(2) INFORMATION FOR SEQ ID NO: 167: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1021 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
15 (D) TOPOLOGY: linear 



{xi) SEQUENCE DESCRIPTION: SEQ ID NO: 167: 

20 ACCGTGGAAA CACGTCTAGT CAATCAGAAA GCGATAAAAA TGTGACTAAA TCATCTCAAG 60 

AGGAAAATCA AGCAAAAGAA GAATTACAAA GCGTTTTAAA CAAAATTAAC AAACAATCAA 120 

GTAAGAATAA TTAAAAAATT TTGATATTGT CTATGTTTAT AGTTCACAAG CCATTCAACG 180 

TATTGTAAAC TAAGGATAGT GTATTTTTTT AATAGTAATT TGTCAGGAGG TGCCTATCTA 24 0 

TGGAAGAACA TTACTACGTA AGTATTGATA TTGGATCATC AAGCGTAAAA ACAATAGTAG 300 

GCGAGAAATT TCACAATGGT ATAAATGTGA TAGGTACAGG ACAAACCTAC ACGAGCGGTA 360 

TAAAAAATGG TTTAATTGAT GATTTTGATA TTGCGCGACA AGCAATCAAA GACACAATTA 420 

AAAAGGCATC AATCGCTTCG GGTGTTGATA TTAAAGAAGT TTTCCTGAAA TTACCTATCA 4 80 

TTGGAACGGA AGTTTATGAT GAATCAAATG AAATCGACTT TTATGAGGAT ACAGAAATCA 54 0 

ACGGTTCACA TATCGAAAAA GTATTAGAAG GTATTAGAGA AAAAAATGAT GTGCAAGAAA 600 

CAG/&GTAAT TAATGTGTTC CCGATTCGTT TTATAGTCGA TAAAGAAAAT GAGGTTTCAG 660 

40 ACCCTAAAGA ATTAATTGCC AGACATTCAT TAAAGGTTGA AGCAGGCGTA ATTGCTATTC 720 

AAAAATCGAT TTTAATTAAT ATGATTAAAT GCGTAGAAGC ATGTGGTGTT GATGTATTAG 780 

ATGTTTACTC TGATGCATAT AACTATGGTT CAATCCTAAC AGCTACTGAA AAAGAGTTAG 840 

GTGCATGTGT CATTGATATT GGTGAAGACG TTACGCAAGT TGCTTTTTAT GAACGCGGTG 900 

AATTAGTAGA TGCTGATTCT ATCGAAATGG CAGGGCGTGA TATTACaGAC GATaTTGCAC 960 

aAGGrTTaAA CACTTCTnAT GAAACTGCTG nAAAAAGTTA AACACCAATn TGGTCATGCA 1020 

T 1021 
(2) INFORMATION FOR SEQ ID NO: 168: 
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(A) LENGTH: 7963 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

5 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 168: 

1Q TAATCTATTA TAAAAACTGT CCATACCCTT TGATTACCTT CTCTTCAGGT ACAGGCCACA 60 

CTTGAGGCCA TAAGCCATAT GCTTGCTGTG AATAAAATTG TGCCATTTGT AACAATATAA 120 

TATATACAAA TAAACACCCA ATAATTGCTG TCACTAATGG ATATGATAAC CAAACCATTA 180 

15 ATAAAACTGC AATAATTACT AACCTAAAGA TAATATTAAA TGCGTCTCTC CCTCTTATAA 240 

AGCTTCTAAT AAATAAGAAT AAATACATCG CATTAGAGTT AAATTTACTA CCCTTTGGAA 300 

CTGGTAAAAG TATATCTAGA TAACTTCTTC TGACTGCAGA TTCTTTCAAA TGTTTTACAT 360 

20 

CGGTGAACAT ATTAACAAAT TTATAATAAT TCATATGATG TCGATGTTCG ATTGCAATCA 420 

TTTTCTCCCA AGGATACAAA AAGCCTGGTT TATATTTTTT AACTAAAAAT TCTATTAACA 4 80 

CAGGCAAAGC AACCATCACA AATGCGATGT ACCATTTTGG AGCTAATAGT AAGTAATATG 540 

25 

TTAGAGCAAA GGTGATGAAT GATATTAAAT TAACTTGCCA TGTTTTAAGT CCCGATTGAT 600 

ACCATTGCCA TCTTAAGCGT AAACCAACAT ATGGAAAAAT TAATGCACTG ACTCCAAAAC 660 

3Q AAATATAAAA TGCCACATTA TGTTGATTAA TATTGTAAAA CAACGGGAAC ATTACAATAA 720 

CAATAATGAG TTGGATTAAT ATGCGCGCAA AGTAACTATA TAAAAT CGCA TGACGCATAA 780 

ATTGAGACAT GTGTTTTTCA AATGGTAATA AAAAGATTTT ATCCgCTTCT TTTAACAGTG 84 0 

35 GTCsCmTTGG AAAAATAGrT GTCAACGCAA CAATCACTGC TGCTATTaAT GAAAAATTGa 900 

TATTCGTTGG AATATGTTTT AACCATTcAC CATATCCArA AATAAATGCA CCCAGCAAAA 960 

TAAGTAAAAA GACCATGAAA TGACCATTAA ATATAAACTT ATTATAATAA TTTTtCTCTT 1020 

40 TACGAAGGGC ATGTAATCTT TTATTAAATA ATGTGGTAGC TTGGTTACGC ATGTACATCT 1080 

CCACCTTGCG TCACATGAAT ATATATATCG TCTAATGTTT GATTATGTAA GCCAGTTTGT 1140 

TGTCTCAATG CTTCTAAATC TCCAAATGCA ACGACTTCAC CTTCGTCTAG TATGaTAAAA 1200 

45 

CGATCACAGT AACGTTCAGC TGTTGCTAAA ATATGTGTAC TCATTAGAAC GGTTCTACCT 1260 

TCGTTTTTCT TTTCAACCAT TAAATCTAAC ATGGATTGAA TTCCTAATGG ATCTAGGCCA 1320 

AGGAATGGTT CGTCTATAAT ATACAATTCG GGATTAACGA TAAACGCACA AATAATCATG 1380 

SO 

ACTTTTTGTT TCATCCCCTT AGAAAAATGA CTCGGAAAAA CTTTCAACTC ATTTTCTAAA 1440 

CGGAATGTCT TTAATAATGG CATTGCTCGA TTCATCGTTT CATCACGATC AATATCATAT 1500 
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TCCGGAATAT AAGATAACTT 


TCTTCTATAA 


GCCTCTATGT 


CATCATTAAT GTTGATATCT 


1620 




GAAATTGATA 


G AG ATCCTT C 


CATAGGTGTA 


AGCAATCCTA 


GCATATGTTT AATCGTTGTA 


1680 


5 


CTCTTACCAG 


CGCCATTAAG 


GCCAATAAGT 


CCAACAATTT 


CGCCTTTGTT TAATTCAAAA 


1740 




TTTATATCTT 


TAATTACAGG 


GCGTTTTCCA 


TATCCACCTG 


TAAGCTGTTC TACTTTAACT 


1800 


10 


GTCATAAGGC 


ACCTCCATGA 


CTTATATTGT 


ACCAAAAATT 


ATAAAATGCT CATATTAAAT 


1860 


ACACATGTCC 


TAATATCGAA 


TTTTTAGCGA 


CAATGTTATA ATGAATGGTA ATACTAGTTG 


1920 




AAAAGGAGTG 


TAGTCATCAT 


GTCAGAAACA 


ATTTTCGGCA AAATTTTAAC TGGAGAAATT 


1980 


15 


CCTAGCTTTA AAGTATATGA AGACGATTAT 


GTCTATGCCT 


TTTTAGATAT ATCACAAGTT 


2040 




ACTAAAGGAC 


ATACGTTATT 


AATTCCTAAA 


AAAGCTTCTG 


CTAATATCTT TGAAACTGAT 


2100 




GAAGAAACAA 


TGAAACATAT 


CGGTGCAGCA 


TTACCTAAAG 


TAGCAAATGC TATTAAGCGT 


2160 


20 


GCATTTAATC 


CTGATGGTTT AAACATTATT 


CAAAATAATG 


GTGAGTTTGC AGATCAATCT 


2220 




GTATTTCATA 


TTCATTTCCA 


CTTAATTCCT 


CGATACGAAA 


ATGATATTGA TGGATTTGGT 


2280 




J.AIAAGTGGG 


AAACACATGA 


AGACATTTTA 


GATAACGATG 


CAAAACAACA AATTGCTGAA 


2340 


25 


Uvwu 1 LAAur 


CACAATTTTA 


AATGTATGCT 


TAATCTAAGC 


TCGAACGGGT ATAATATGAT 


2400 






ACAATTGCGT 


TTGAAGTGAT 


AACATCAAGG 


TTAGCAATTT TAAACAAAAT 


2460 




n z^n tt a t p a. a 

1 Xnl win 


GATAACAGAT 


GTTAAAAGTG 


AGGAGAATAT 


AAATGAAAGC ATCACGCATT 


2520 


30 


CTATTCGGTA 


TCGGTGTTGG 


CGTAGCAGCT 


GGTTTTGTAG 


TTGCACTTCA AGGACGTGAC 


2580 




GACAAAAGTG 


TCAAGAACAA 


CACGATCGAT 


CGTACTGCCC 


CTACTGGTTC AAAATCAGAA 


2640 


35 


CTACAACGTG 


AATTTGAAAC 


GATTAAACAA 


AGTTTTAATG 


ACATTTTAAA CTATGGTGTT 


2700 


CAAATTAAAA 


ACGAAAGTGC 


GGAATTTGGT 


AGTTCAATTG 


GTGGTGAAAT TAAGTCATTA 


2760 




CTTGGAAACT 


TCAAATCTGA 


CATTAATCCT 


AATATTGAAC 


GTTTACAGTC ACACATCGAA 


2820 


40 


AATTTACAAA 


ATCGTGGCGA 


GGATATTGGA 


AACGAAATTT 


CTAAGTAGCA GGTTACGTTC 


2880 




TCGATCACAA 


CTATTTTTAT 


TAGTAACAGC 


ATATTTATTT 


TTTAAAATTA AATGCCAAAT 


2940 




AAACGAGATG 


ACATTAGAAA 


TTAGATATTT 


CTTGTCATCT 


CTTTTTTAAA ACTCAAATGA 


3000 


45 


ACTTATGTTT 


ACAAATTATA 


GGAAGACATT 


GTTTGTAGTG 


ATTTTCGCTT AAATCATATT 


3060 




TATGAATTGA 


TTGAAAACAT 


TGCTTAGGAT 


TCATTGTGTT 


ATCCtTGCAC TTTGATTACG 


3120 




CTTTACTTAA 


ATCATTATCG 


ACAAACAACA 


TACTTATATT 


TTCATTGAGC CGAACCTTAT 


3180 


50 


ATACACATTA 


CATATACCTT 


ACTTGCACAA 


ATTATTAATC 


TGGTGTTTAT TATAATTACA 


3240 




TATCACTATA 


riTlTAGCAT 


TTGTATAACT 


TAGTTGGTCA 


AAAGATGCTT TTGCATATGC 


3300 
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TTTCATAAGT GATGCTTTAT TAGCAAGAAT ATGTGTTCGC AGAAATTTGT TCTGCATTCT 


3420 




ACTTCTACGC TAGTCAATCA GACAATTTTA CCAATCCCCA CTTTCGCGTT 


TCAAATCAAA 


3480 


5 


CAATACGTCG CTCCTTTCTT CTTATATAAC AATTCTTCTA ACATGATATG TTACTATTGA 


3540 




ATTACTGAAC CTGAGTTAGT TATAATCTAA CTTATATTGA AAAGAGATGA 


GGCGTAAGAT 


3600 




ATGTTTTTAT GTAAAAGACA AATTGATATC AATGCACGAT TTGGTTTGCC TAGAATTGCA 


3660 


70 


TTTATGAGTG CAGTTGCAAC CATCATTATG TTTTTAGTTA GTTATGAAGT 


AATGTATTTT 


3720 




TTATCTAATA CGCCATTATC AGATAGACAT TTTCTCATCT TTTTATTACT 


TGTATTTATG 


3780 


15 


ACGTATCCAT TACATAAAAG TATACATTTA TTATTTTTCT TACCATATAG 


AAAATCGTTT 


3840 


AAAGTTCATA AGTTAACTAA AAGAAAATGG CTTATATTCT ATAATACCTA 


CGTCAATCAA 


3900 




CCTGTACACA AATTTTATTT TTGCATTAAC TTAATATTGC CGTTAATTAT 


CTTATCTGCA 


3960 


20 


ATGTTCGTTT ATCTAACAAT TTCATTCCCG CAATATGGAC ATTATTTTAT 


GTTCTTATTG 


4020 




GCATTGAATT TCGGTATTTC CATTACAGAT TTATTATATT TAAAAATAAT 


TATATTTTCT 


4080 




AATTATGGAC AATATATAGA AGAACATAGT ACAGGTATTA ATATTTTGAA 


AAAAATTAAA 


4140 


25 


AATCCATATC ATTTATAACA AAATAATTAT AGCAAGGTGT TATTATTTGT 


TTTTAGGCTA 


4200 




TGTAATAgcT tACAATCAAA TGTATATAGA CCTTGTTTTT TTATTTTCAT CAATTTCTAC 


4260 




CCCTAAACCT AATGCTCTAG TCTGATGTCA TGGGTTATTG ATTGGTGATA 


ATATAAAACT 


4320 


30 


ATGTTATATT CACGATGATT AACTTACAAA GGAGTTTCAA CTATGAAGAT 


GATAAACAAA 


4380 




TTAATCGTTC CGGTAACAGC TAGTGCTTTA TTATTAGGCG CTTGTGGCgC TAGTGCCACA 


4440 




GACTCTAAAG AAAATACATT AATTTCTTCT AAAGCTGGAG ACGTAACAGT 


TGCAGATACA 


4500 


35 


ATGAAAAAAA TCGGTAAAGA TCAAATTGCA AATGCATCAT TTACTGAAAT 


GTTAAATAAA 


4560 




ATTTTAGCTG ATAAATATAA AAATAAAGTT AATGATAAGA AGATTGACGA ACAAATTGAA 


4620 


40 


AAAATGCAAA AGCAATACGG CGGTAAAGAT AAATTTGAAA AGGCCCTTCA 


ACAGCAAGGT 


4680 


TTAACAGCCG ATAAATATAA AGAAAATTTA CGTACTGCTG CTTATCATAA 


AGAATTACTA 


4740 




TCAGATAAAA TTAAAATCTC TGATTCTGAA ATTAAAGAAG ACAGCArGAA AGCTTCACAC 


4800 


45 


ATTTTAATTA AAGTTAAATC TAAGAAAAGC GACmAAGAAG GCTTAGATGA 


TAAAGAAGCG 


4860 




AAACAAAAAG CTGAAGAAAT TCAAAAAGAA GTTTCAAAAG ATCCAAGTAA ATTTGGTGAA 


4920 




ATCGCTAAAA AAGAATCAAT GGATACTGGT TCAGCTAAAA AAGATGGCGA ATTAGGTTAT 


4980 


50 


GTTCTTAAAG GACAAACTGA TAAAGATTTT GAAAAAGCAC TATTTAAGCT TAAAGATGGT 


5040 




GAAGTATCAG AGGTTGTTAA ATCAAGCTTT GGATATCATA TTATTAAAGC 


TGATAAACCA 


5100 
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AAAAATCCAA AATTATTGAC TGATGCATAC AAAGATCTAT TAAAAGAATA CGATGTTGAC 5220 

TTTAAAGATC GTGATATTAA ATCAGTTGTC GAAGATAAAA TCTTAAACCC TGAAAAACTT 5280 

AAACAAGGTG GCGCACAAGG CGGACAATCC GGCATGAGCC AATAACACAA AACCGAGCGA 5340 

CCGTGGTTCA AAAATCATAC CACGGCCGCT CGGTTTTTTC GCATTAAAAA TCGGACAGAT 5400 

GAGCTCATGT TTCAGTATAC TCATCTGTCC GATATCTTTT AATTCTTAAT CGAGTGATTC 5460 

AGGATTGTAG AATCTACGAT TTTCAAGACC AAATATTTTA TCTGTAAACT GACCCTTGTC 5520 

AGTTTTTTTA TATGCCTTTT CAAACATATT CATTCTAGCA TCGATATTAT CGATATAGCA 5580 

TAAAATTTCT GCTTCTTTTA AGTATGGCAG TTTTGGAGAA CCATACTCTA ACTTACCATG 564 0 

ATGAGATAAA ATCATATGTC TTAACAACAT GATTTCTTCT CCTTCAATGT TCAATTCACG 5700 

AGCTGCTTCA ACTACTTCAT CACTCGCAAT CGAGATGTGT CCTAATAAGT TACCTTCGAC 5760 

TGTATACGAC GTCGCAACAG GACCACTCAA TTCTCTAACT TTACCAATAT CATGCAAAAT 5820 

AATACCACTA TATAACAAAC TTTTGTTTAA CAATGGATAA ATGTCaCAAA TTGATTTTGC 5880 

AATACGTAAC ATCGTTAATA CATGATAGCT TAAGCCACTC GCAAAGTTAT GaTGATGAGA 594 0 

25 ACTAGCAGCT GGATATGTGT AAAATCGTTC TTGATATTTT TTCAATAAAT GACGTGTGAT 6000 

ACGTTGTAAA TTAGCATTTT CAATATCTAG CAAATAATGA GAAATCTCTT CTTGTATTTC 6060 

TGCCGGTGAT AAAGGTGCAC CATCTACAAA TTGTTCTGTT TTTAATTGAT CTTCAGTTGT 6120 

30 CGCTAGTCTA ATTTGGTTGA CTTTCATCTG TTTATTTCCG CGATAGTTTA TGATGTCACC 6180 

TTTAACATGT ACAATTT CTT CAGGCTTGAT TGTTGCCATA TCATTTTTTG TAGCCGTCCA 6240 

AAATTTCGCT TCAATTTCAC CACTTTTATC TTGCAAATGT AATGTCATAT AATCTTTACC 6300 

TTGTGCTGTT ACACCCTGTG TAGCTTTATG CACTAAGAAA AAGTGATCAA CTGAATCTCC 6360 

GGGaStTAGA TTCTCTATAT TTCTCATCGT TTCCCGCCTT CCTCTATTTT GTTTAATGTA 6420 

ATCACTTCTT TTGATGGAAC AATATTATCT TTTACACATG TAAAGTATAG TACTTGATAG 64 80 

TGTTCTGATA ATGATCGTAA ATAATTCAAC ATTTTTTCAG TACGTTTTTT ATCAAAATGA 6540 

ACAAATGCAT CATCAACAAT TAATGGGAAC GGATAATATG GTCTTAGTAC CTTAATTAAA 6600 

45 CTGATACGTA AAGCTACATA AAGTAATTCT TTTGTAGATT GACTTAGTTC AACAGGATCA 6660 

TATAATTGAC CATTAACATG TTTAACCGTA ATTGAATCTT CATTATAGTT AATCATCGTA 6720 

TATCTGCCAT CTGTTAAATG CTTCAATATT TCTACCGCTT CATTAATAAC TTGAGGCAAA 6780 

SO CGTTTATCTT TAATTTGTTT AATGTGTTCA TCAACTAAAC TTTGTAAATA ACTTAAACTT 6840 

GCCCAATCTT TTGCGATATC ATTAAGTTGA TTTTTAAGAC TGTGATATTC ATGTCTTAAA 6900 
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GCTTGCATTT CAAGATATTG CTCATTATAT TCGTCAACTT GAGTAGCCAA TAAATGATCT 7020 

TCTTCTTCAA GTTGTGCAGT TGTTTTTTCA CTTAAACTAG AACTTAATTC ATAAGAATAG 7080 

S TTTTGGTTCT CAAGATATTT AGTTAAATCA TTAAAACGAC TCAAATTACT AGTATAAGTT .7140 

TGGTAATCTT CATGATGTTG GTAAAAATCT TCTTCAGTAC CAACATTGAT AAAATCGAAT 7200 

AGTGCTGTAA TTTCTTTATT ATTTTCTTCT AATTGAGCAT TTAAATGATT TAATTCATTT 7260 

10 GTAACAAGTT TGGTATTTTC AGCATTAATA CGCCATTTTT CATTCGTGTC TTCAGCTGAT 7320 

TTCAACCATT GTtGCACATC GTGGAATAAA GATAATTTGT TGAAATAAAC AAATTGTGAT 7380 

TTTGTAACAG CTTCAGCATG ATTGTAGAAT GTATCTAATT CTTGAACCAA TTGCTGGCGT 7440 

15 

TGTTGATTTA AATCACTGAT ATGTTGATCT AATGCTTTAA TATTCGCCAT TGTAGAAATA 7500 

CTATCAACAA TTAAATCATT TGAAATTTTA GATGATAAGT ATAATTCATC CTTAACGTTC 7560 

TCAACTGTCG ATTGTAATTC ATCATGACGC CCTTTCGCAT CATTTAAACG ACCTTCAATA 7620 

20 

TACTGACGTT TCTCTTCTAA AATATCTTTA TTTTTCAAAG CTTGTTGCCA GTGATCACGA 7680 

ATGCGATATT GCTCATCAAG ATCAAAATCT AAGTCATAAT TTTCATCTAA AATGGCTAGT 7740 

25 TGTGCTTTAA TTTCTTCGAT TTCATCTGTG ATGGCCTCGC TATAATCTAC TTCTTTTGAT 7800 

TTAGACATGA TGATACCGAT AACAAATACT AAAGTTAATA CTGCGAAAAT AATACCAAAC 7860 

AACATGTTGT TTGAAATAAA TGAGAAGGCA GTTAAACCAA TACCTACTAA TGTTAAAAGr 7920 

30 ATAAACGTTG TTCGkAACAA TTTTTGACGT TTTTGttTTT CTT 7963 

(2) INFORMATION FOR SEQ ID NO: 169: 

(i) SEQUENCE CHARACTERISTICS : 
35 (A) LENGTH: 3958 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 
T (D) TOPOLOGY: linear 

40 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 169: 
ATATTGTCTT TACAATAGTT TGCTATGGAG GTAATTAACC AATAGGAGGA ATTTATAATG 60 
GCAGTAATTT CAATGAAACA ATTACTAGAA GCGGGTGTTC mCttCGGTCA CCAAACACGT 120 

45 

CGTTGGAACC CAAAAATGAA AAAATATATC TTCACTGAGA GAAATGGTAT TTATATCATC 180 
GACTTACAAA AAACAGTGAA AAAAGTAGAC GAGGCATACA ACTTCTTGAA ACAAGTTTCA 240 
50 GAAGaTGGTG GACAAGTCTT ATTCGTAGGA nCTAAAAAAC AAGCACAAGA ATCAGTTAAA 300 
TCTGAAGCAG AACGTGCTGG TCAATTCTAC ATTAACCAAA GATGGTTAGG TGGATTATTA 360 
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GAAGATGGTT TATTCGAAGT ATTACCTAAA AAAGAAGTAG TAGAACTTAA AAAAGAATAC 4 80 

GACCGTTTAA TCAAATTCTT AGGCGGAATT CGTGATATGA AATCAATGCC TCAAGCATTA 540 

TTCGTAGTTG ACCCACGTAA AGAGCGTAAT GCAATTGCTG AAGCTCGTAA ATTAAATATT 600 

CCTATCGTAG GTATCGTTGA CACTAACTGT GATCCTGACG AAATTGACTA CGTTATCCCA 660 

GCAAACGACG ATGCTATCCG TGCGGTTAAA TTATTAACTG CTAAAATGGC AGATGCAATC 720 

TTAGAAGGTC AACAAGGCGT TTCTAATGAA GAAGTAGCTG CAGAACAAAA CATCGATTTA 780 

GATGAAAAAG AAAAATCAGA AGAAACAGAA GCAACTGAAG AATAATCAAC TGTTGAATCT 840 

GACTTAGATA TAGTTTAAAT GGGTGATAAG ATATTAATGC TTATCACCTT TTTTAAAAAG 900 

AAAATCGAGG CAAATTACAA ATATTCAATT AGAGTATTGG CAATCTTGCC TATAATAATG 960 

CTAAAATCAT AATATATAAn ATGATAACTT ATTGGAGGAA TAATGAATGG CAACTATTTC 1020 

AGCAAAACTT GTTAAAGAAT TACGTGAAAA AACTGGCGCG GGTATGATGG ATTGTAAAAA 1080 

AGCGCTAACT GAAACTGATG GTGACATCGA TAAAGCGATT GACTACCTAC GTGAAAAAGG 1140 

TATTGCTAAA GCAGCTAAAA AAGCAGACCG TATTGCGGCT GAAGGTTTAG TACATGTAGA 1200 

25 AACTAAAGGT AACGACGCAt TATCGTTGAA ATCAACTCTG AAACAGACTT TGTTGCTCGT 1260 

AACGAAGGTT TCCAAGAGTT AGTTAAAGAA ATCGCTAATC AAGTATTAGA TACAAAAGCT 1320 

GAAACTGTTG AAGCTTTAAT GGAAACAACT TTACCAAATG GTAAATCAGT TGATGAAAGA 1380 

ATTAAAGAAG CAATTTCAAC AATCGGTGAA AAATTAAGTG TTCGTCGTTT TGCTATCAGA 1440 

ACTAAAACTG ATAACGATGC TTTCGGCGCT TACTTACACA TGGGTGGACG CATTGGTGTA 1500 

TTAACAGTTG TTGAAGGTTC AACTGACGAA GAAGCAGCAA GAGACGTTGC TATGCATATC 1560 

GCTGCAATCA ACCCTAAATA TGTTTCTTCT GAACAAGTTA GCGAAGAAGA AATCAACCAC 1620 

GAAAQAGAAG TTTTAAAACA ACAAGCATTA AATGAAGGTA AACCAGAAAA CATCGTTGAA 1680 

AAAATGGTGG AAGGACGTTT ACGTAAATAC TTACAAGAAA TTTGTGCTGT AGATCAAGmT 174 0 

TCGTTAAAAA CCCTGATGTA ACAGTTGAAG CTTTCTTAAA AACAAAAGGT GGAAAACTTG 1800 

TTGACTTCGT ACGCTATGAA GTAGGCGAAG GTATGGAAAA ACGCGAAGAA AACTTTGCGG 1860 

ATGAAGTTAA AGGACAAATG AAATAATCTG TCATAAAGTA AAACAAGGAA GAAGACACCT 1920 

TTAATGTTGC TTTATTAAAA TGTAAATCAT TCTAATAAAA CGACAACTGT GTCTTCTTTA 1980 

CTTGTATATG TTACATATAT TCACGATAGA GAGGATAAGA AAATGGCTCA AATTTCTAAA 204 0 

50 TATAAACGTG TAGTTTTGAA ACTAAGTGGT GAAGCGTTAG CTGGAGAAAA AGGATTTGGC 2100 

ATAAATCCAG TAATTATTAA AAGTGTTGCT GAGCAAGTGG CTGAAGTTGC TAAAATGGAC 2160 
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TTAGGTATGG ACCGTGGAAC TGCTGATTAC ATGGGTATGC TTGCAACTGT AATGAATGCC 2280 

TTAGCATTAC AAGATAGTTT AGAACAATTG GATTGTGATA CACGAGTATT AACATCTATT 2340 

GAAATGAAGC AAGTGGCTGA ACCTTATATT CGTCGTCGTG CAATTAGACA CTTAGAAAAG 24 00 

AAACGCGTAG TTATTTTTGC TGCAGGTATT GGAAACCCAT ACTTCTCTAC AGATACTACA 2460 

GCGGCATTAC GTGCTGCAGA AGTTGAAGCA GATGTTATTT TAATGGGCAA AAATAATGTA 2520 

GATGGTGTAT ATTCTGCAGA TCCTAAAGTA AACAAAGATG CGGTAAAATA TGAACATTTA 2580 

ACGCATATTC AAATGCTTCA AGAAGGTTTA CAAGTAATGG ATTCAACAGC ATCCTCATTC 2640 

TGTATGGATA ATAACATTCC GTTAACTGTT TTCTCTATTA TGGAAGAAGG AAATATTAAA 2700 

CGTGCTGTTA TGGGTGAAAA GATAGGTACG TTAATTACAA AATAAATTTA GAGGTGTAAA 2760 

ATAATGAGTG ACATTATTAA TGAAACTAAA TCAAGAATGC AAAAATCAAT CGAAAGCTTA 2820 

TCACGTGAAT TAGCTAACAT CAGTGCAGGA AGAGCTAATT CAAATTTATT AAACGGCGTA 2 880 

ACAGTTGATT ACTATGGTGC ACCAACACCT GTACAACAAT TAGCAAGCAT CAATGTTCCA 2940 

GAAGCACGTT TACTTGTTAT TTCTCCATAC GACAAAACTT CTGTAGCTGA CATCGAAAAA 3000 

25 GCGATAATAG CAGCTAACTT AGGTGTTAAC CCAACAAGTG ATGGTGAAGT GATACGTATT 3060 

GCTGTACCTG CCTTAACAGA AGAACGTAGA AAAGAGCGCG TTAAAGATGT TAAGAAAATT 3120 

GGTGAAGAAG CTAAAGTATC TGTTCGAAAT ATTCGTCGTG ATATGAATGA TCAGTTGAAA 3180 

AAAGATGAAA AAAATGGCGA CATTACTGAA GATGAGTTGA GAAGTGGCAC TGAAGATGTT 3240 

CAGAAAGCAA CAGACAATTC AATAAAAGAA ATTGATCAAA TGATTGCTGA TAAAGAAAAA 3300 

GATATTATGT CAGTATAAAA CTAATATACA ATGACATATT AAAATGCCAG TATTAAACGA 3360 

TAATGTAACA TTTAAAATGG GCATGTTTAA TTAAATCAAA GATGCATGTG ATAATTTAAA 3420 

TTCAGAATGA GCATAAAAAT GGTGTTTAAA CAAGTTAATT AAACATATAC TTTATAAATA 3480 

ATAGGCATTA GGTATATTGC TATAATAAAG TTATGTAATT TTTAACCTCA GTATGTATGT 3540 

CACATTTCTG GTGTAAACTG TACCGAGTCA GACTTTGGTA CAGTTTTTTT ATTTGCTTAT 3600 

TCAATGCATT AAATGAGTAT GATAAAATGA TAATGATTGT TTAGTAACTT ATACTATATG 3660 

ACAGAGATGA TCAGGCTCGG AGGAAAGACC ATGTTTAAAA AGCTAATAAA TAAAAAGAAC 3720 

ACTATAAATA ATTATAATGA AGAATTAGAC TCGTCTAATA TACCTGAACA TATCGCTATT 3780 

ATTATGGATG GTAATGGGCG ATGGGCTAAG AAGCGAAAAA TGCCTAGAAT TAAAGGTCAT 3840 

50 TACGAAGtAT GCAAACAATA AAAAAAATTA CTAGGGTAGC TAGTGATATT GGTGTTAAGT 3900 

ACTTAACTTT ATACGCCTTT TCCACTGAAA ATTGGTCAAG ACCTGAAAGT GAAGTAAA 3958 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5333 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 170: 

10 

ATTAAAACAA CTTAATATAC CTATTTATGG TGGTCCTTTA GCATTAGGTT TAATCCGTAA 60 

TAAACTTGAA GAACATCATT TATTACGTAC TGCTAAACTA AATGAAATCA ATGAGGACAG 120 

TGTGATTAAA TCTAAGCACT TTACGATTTC TTTCTACTTA ACTACACATA GTATTCCTGA 180 

15 

AACTTATGGC GTCATCGTAG ATACACCTGA AGGAAAAGTA GTTCATACCG GTGACTTTAA 240 

ATTTGATTTT ACACCTGTAG GCAAACCAGC AAACATTGCT AAAATGGCTC AATTAGGCGA 300 

20 AGAAGGCGTT CTATGTTTAC TTTCAGACTC AACAAATTCA CTTGTGCCTG ATTTTACTTT 360 

AAGCGAACGT GAAGTTGGTC AAAACGTAGA TAAGATCTTC CGTAATTGTA AAGGTCGTAT 420 

TATATTTGCT ACCTTCGCTT CTAATATTTA CCGAGTTCAA CAAGCAGTTG AAGCTGCTAT 4 80 

25 CAAAAATAAC CGTAAAATTG TTACGTTCGG TCGTTCGATG GAAAACAATA TTAAAATAGG 54 0 

TATGGAACTT GGTTATATTA AAGCACCACC TGAAACATTT ATTGAACCTA ATAAAATTAA 600 

TACCGTACCG AAGCATGAGT TATTGATACT ATGTACTGGT TCACAAGGTG AACCAATGGC 660 

on 

AGCATTATCT AGAATTGCTA ATGGTACTCA TAAGCAAATT AAAATTATAC CTGAAGATAC 720 

CGTTGTATTT AGTTCATCAC CTATCCCAGG TAATACAAAA AGTATTAACA GAACTATTAA 780 

TTCCTTGTAT AAAGCTGGTG CAGATGTTAT CCATAGCAAG ATTTCTAACA TCCATACTTC 840 

35 

AGGGCATGGT TCTCAAGGTG ATCAACAATT AATGCTTCGA TTAATCAAGC CGAAATATTT 900 

CTTACCTATT CATGGTGAAT ACCGTATGTT AAAAGCACAT GGTGAGACTG GTGTTGAATG 960 

CGGCGTTGAA GAAGATAATG TCTTCATCTT TGATATTGGA GATGTCTTAG CTTTAACACA 1020 

40 

CGATTCAGCA CGTAAAGCTG GTCGCATTCC ATCTGGTAAT GTACTTGTTG ATGGTAGTGG 1080 

TATCGGTGAT ATCGGTAATG TTGTAATAAG AGACCGTAAG CTATTATCTG AAGAAGGTTT 114 0 

45 AGTTATCGTT GTTGTTAGTA TTGaTTTTAA TACAAATAAA TTACTTTCTG GTCCAGACAT 1200 

TATTTCTCGA GGATTTGTAT ATATGAGGGA ATCAGGTCAA TTAATTTATG ATGCACAACG 1260 

CAAAATCAAA ACTGATGTTA TTAGTAAGTT AAATCAAAAT AAAGATATTC AATGGCATCA 1320 

SO GATTAAATCT TCTATCATTG AAACATTACA ACCTTATTTA TTTGAAAAAA CAGCTAGAAA 1380 

ACCAATGATT TTACCAGTCA TTATGAAGGT AAACGAACAA AAAGAATCAA ACAATAAATA 1440 
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GCTTTTTCTT TATATATGAT GAGCTTGAGA 


CATAAATCAA 


TGTTCAATGC TCTACAAAGT 


1560 




TATATTGGCA GTAGTTGACT GAACGAAAAT 


GCGCTTGTAA 


CAAGCTTTTT TCAATTCTAG 


1620 


5 


TCAGGGGCCC CAACATAGAG AATTTCGAAA 


AGAAATTCTA 


CAGGCAATGC GAGTTGGGGT 


1680 




GTGGGCCCCA ACAAAGAGAA ATTGGATTCC 


CAATTTCTAC 


AGACAATGTA AGTTGGGGTG 


1740 




GGACGACGAA ATAAATTTTG AGAAAATATC ATTTCTGTCC CACTCCCGAT TATCTCGTCG 


1800 


10 


CAATATTTTT TTCAAAGCGA TTTAAATCAT 


TATCATGTCC 


AATCATGATT AAAATATCAC 


1860 




CTATTTCTAA ATTAATATTT GGATTTGGTG 


AAATGATGAA 


CTCTTTGCCT CGTTTAATTG 


1920 


15 


CAATAATGTT AATTCCATAT TGTGCTCTTA 


TATCTAAATC 


AATGATAGAC TGCCCCGCCA 


1980 


TCTTTTCAGT TGCTTTCAAT TCTACAATAG 


AATGCTCGTC 


TGCCAACTCA AGATAATCAA 


2040 




GTACACTTGC ACTCGCAACA TTATGCGCAA 


TACGTCTACC 


CATATCACGC TCAGGGTGCA 


2100 


20 


CAACCGTATC TGCTCCAATT TTATTTAAAA 


TCTTTGCATG 


ATAATCATTT TGTGCTTTAG 


2160 




CAGTTACTTT TTTTACACCT AACTCTTTTA 


AAATTAAAGT 


CGTCAACGTA CTTGATTGAA 


2220 




TATTTTCACC AATTGCCACA ATGACATGAT 


CAAAGTTACG 


GATACCTAAA CTTTTCATAA 


2280 


25 


CTGCTTCATC TGTAGTGTCT GCAACAACCG CATGAGTAGC GATATCACTA TATTCATTCA 


2340 




CTCTATTTTC ATCATGGTCG ATGGCCATTA 


CATCCATGTC 


TAATGCATTC AACTCACGAA 


2400 




CGATACTACC TCCAAAACGA CCTAGACCGA 


TGACTACATA 


TTCTTTACCC ATACTCGCCC 


2460 


30 


TCCATTAAAT GATTTTCATC AATTCATTGA 


AAATATAAAT 


TTAAAATTAT TATAAATGAG 


2520 




TACCCCAACT AAATTATCTA AATGCAGTAA 


TGCAAGTAAA 


TGAAAGTTGG GGTATCGTCT 


2580 




CAACTTATGA TTTCTTTCCT TCAACATATT 


CTTTGTCGAA 


AACAAATAAT CTTAATAATA 


2640 


35 


ATATTAACGA TGGAAGTAAT AAAAGTAAAC 


CTAAAATAAA 


GACAATCACT AATGTCCAGC 


2700 




CCATStCTGG ATTAACATAT GCATCTGTAA 


TTTTTACAAA 


CGGATATAAA AGGTATGGCA 


2760 


40 


ATTTACTAAT TCCATAGCCA AAGAACGCGA 


ACATCATTTG 


TAAAATAACA AATACAAAAG 


2820 


CCAAACCATG TTTTTTCTTA AAGAATGTTA ACAATGAAGC 


TAATGCAAAG AATAAGAAAC 


2880 




TTATACCAAA CATCCACCAA TAGTCAAAAA 


CAGCTGAATA 


AAAATGTTCA GAATTTTGAA 


2940 


45 


TGCGTAATGA TAGAAATACG AATAAACAAA 


TGATAATCAT 


CGGCGGCCCT AAAAATATGT 


3000 




GCCATTGTCT TGTTAAATTA TATGCTGGTT 


CGTCATTTGC 


TTTTTTAGCA TAATATGTCA 


3060 




AAAATCCTGA TGAAATATAT AAAACTGAAA 


TAATTGCCAA GAATACTACA GACCAAGCAA 


3120 


50 


ATGGGCTTAA TAATAACTGC ACCCAATCTA 


GATCGATAAC 


ATTGTTTCGA ACATTAATAT 


3180 




AGCCACCTTC TGTAATAGTT AAAGCAGTAG ATAATGAAGC 


TGGAATTAAT AATCCACTTA 


3240 
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AACTGTTTCT 


CAACGATATC 


ATAATCAGTG 


CTATTGAACC TGGTATTAAC AATACCGTGC 


3360 




CTAAATATTT 


GATTGACTCT 


GGAAAGAAAC 


CTACGAATCC 


TACGAAGAAG 


AAAACAAAGA 


3420 


$ 


ATACATTCGT AACTTCCCAA ACTGGGTTTA AATAACGTGA AATTAAGTGA TTAATTTTCT 


3480 




TTTCATCACC 


AGTTAACTTT 


GAATGCAATG 


CGAAGAAACC 


TGCCCCAAAA 


TCTATAGAAG 


3540 




CAATAATGAT 


ATAGCAAAAT 


AAAAACAACC 


ATAACACTGT 


TATACCTATA AATGCATAAA 


3600 


10 


TCATTTTTCT 


ATTTCTCCTC 


CTTGCTTCTT 


GGCTAAACGA 


TTTACATCTT 


CATACGCCGG 


3660 




TTTATTTTTA 


AACATACGAA 


TTAATACGTA 


TGCACATGTA 


TACATTAAAA 


TGATGTACAA 


3720 


15 


TATGCCAAAT 


AAAATTGTAA 


CGAaGGTTAT 


TCCGCCTGCT 


TGTGTTGCTG 


CTTCTGCCAC 


3780 


GCGCATATAA 


CCACGAACAA 


TCCAAGGCTG 


TCTACCCATC 


TCTGTTAAGA 


ACCATCCAAA 


3840 




TTCTATAGCT 


AGCATTGAAG 


CTGGGCCTGT 


TAATAATATT 


CCATAAAGCA 


TCCATTTATG 


3900 


20 


AGTAGAAAAC 


TTTCTAAGCT 


TTTTAAACAT 


TAAAGTTAAG 


ACATAAACAC 


CTGAAATGAC 


3960 


AAAACATAAA 


ATTCCCATCG 


TTACCATTAA 


ATCAAAGAAA 


TAATGGACGA 


TCATAGGCGG 


4020 




ATGTAAACTT 


TTTGGAAAAT 


CATTTAACCC 


TTGTACTTTA 


GTTTTGACAC 


TATTATCTGC 


4080 


25 


TAAGAAACTC 


AATAGTCCAG 


GTAATTCAAT 


CGCACCTTTA ACTTGCTGAG 


TCTTTTCATC 


4140 




TAACACACCA 


AATAATAATA 


ATTTGGCATG 


GGAAGATGTA 


TCGAAATGCC 


ATTCATAAGC 


4200 




TGCTAATTTT 


TCAGGTTGGA 


ATTTATGCAA 


AAATTTTGCA 


GATAAATCCC 


CTGCCAACAT 


4260 


30 


AGAAAGTAAT 


GTTGAAAAGA 


ATCCAACTAT 


CATAGACATT 


TTCAAAGCTT 


TCTTATGGTA 


4320 




GACAGTATCT 


TTAGGTTGAC 


GATTACGCAA 


TAATTTAAAA 


GCTGCTATTG 


ATGCAATAAC 


4380 




AAATGCCATC 


GTCATACCGG 


CTGTAGTAAT 


TACGTGAAAT 


GATCGAACTA 


TAAACGATGG 


4440 


35 


GTTAAACATC 


GCTTCTATAG 


GTTGAACATT 


GACCATCTTT CCATTCTTCA ACTCAAAACC 


4500 




TGCAGGCGTA TTCATAAATG AATTCACTGA AGTAATGAAG AATGCTGAGA AAGAGCCACC 


4560 


40 


AATAATTACT 


GGTATACTAA 


TTAAGAAATG 


TGTCCATTTA 


TTTTTAAAAC 


GATCCCAAGT 


4620 


ATATAAATAT 


ATACTTAAGA AAATAGCTTC 


AAAGAAGAAC 


GCAAATGTTT 


CCATAAATAA 


4680 




TGGAAGTGCA 


ATAACGTGTC 


CACCCATTTC 


CATAAATGTA 


GGCCAAATCA 


ATGATAATTG 


4740 


45 


AAGTCCTATA ATTGTACCTG 


TAACAACTCC 


CACTGCTACA GTAATTGTAT AAGCTTTAGC 


4800 




CCATCTTTTG 


GCC AT AGCTA 


TATATTGAAG 


ATCATTTTTG 


CGAATACCTA 


AAAATTCTGC 


4860 




AATTGCGAAC 


ATTAAAGGCA 


TACCAACACC 


AATCGTTGCA 


AAAATGATAT 


GAACTGCTAA 


4920 


50 


AGTCATAGCT 


GTCAAAAACC 


GACTGATTTC 


AACTGTATCC 


ATTTAAAAAC 


ATCACCTTTT 


4980 




TCTTriTTTG 


ATGACAACAC 


AATGAACTTA 


ATTATAATTG 


CTATAATGTG 


TATTTTTAAA 


5040 
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GAATTTCAAT GTATAATTGT GTATATTACA TTAGAATAAA GCACGAAGGA GCATGATACA 5160 

TGTCAGAAAT AATCGTTTAT ACGCAGAATG ATTGTCCACC TTGTACATTT GTAAAAAATT 5220 

5 ATCTAAATGA GCATCACATT GATTTTGAAG AGAGAAATAT CAACAATCAA CAATATCGAA 5280 

ACGAAATGAT AGATTTTGAT GCTTTTTCAA CTCCGTTTAT TTTGTTGAAT GGC 5333 

(2) INFORMATION FOR SEQ ID NO: 171: 

10 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 11126 base pairs 
<B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

15 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 171: 

2Q ATACGTGACC CTTTATCCGA AAATTTCTTT TCATATTCTG TTAAAATATT ACTGCCATCG 60 

TCTTCTTGAT GTAAATTTAG ATTTATTTTT GTAAAATACA TTCCAAATTG AGACATACTT 120 

TCTAAACTGT AGGCAAATAG TCCTCTGTTA TCAGTTTTAA AATGTAAATC TCCTTCATCA 180 

25 TTTAAGATTT GTTGATACAA CGCTAAAAAC GTATGATACG TTAAACGTCG TTTTGCATGA 24 0 

CGATTTTTTG GCCATGGATC TGAAAAGTTC AAATAAATAC GCGAAACTTC GCCGTCTTTA 300 

AAATATTCAT TTAATTCAAT GGCGTCATTA CAAATAATCT TTAAATTTGT TAAACCCATC 360 

30 TCTTTAACTT TATCCAATAC TTTATAAACG ATACTTTTCT CACGTTCCAT TGAAATATAG 420 

TTAATATGAG GATTTTGAGC AGCTAATGTT GTAATAAACT GCCCCATACC CGAACCAATT 4 80 

TCAATGTGTA TCGGTTGCGT TTTaTCAAAC CATTCAGTCA TTTTCCCTGc ATGTTGACCG 540 

35 

TCCATGTCAA CCAATTCAGG ATGATCTTTT AAATAATCTT CAGCCCATGG TTTGTATCGA 600 

ACTCTCATAT TTTATTCTCC TCTTAAATAA ACATGTTACT ATTCATAACT TCATTTAGGA 660 

ATTTAAGCCA AGTGTTCATA TCCTTATATC TTTTTTGCTC TTCATACCAT TGAACAAGAC 720 

40 

CTATAGATTG AATTACCGTA TACCATTTCA TACGTTTATT TAAATTCAAG CTCTCTTGAA 780 

CACCATATGT TTCAAGCCAT TCAGACCATT GTTGTTGTGG AACATAGTTG TAAAGCAGCA 840 

^ TTCCGATATC AATTGCCGGG TCTGCAATCA TTGCACCTTC CCAATCAACT AAAAATAGTT 900 

CATCTCGATC GGATAATAAC CAATTATTAT GATTCACATC ACCATGTACA ACAGTGAAAA 960 

AACGCGAATC TAAACTCGGT ATATGCTCTT CTAAATAGGT TAATGATTTT CTCACAATAT 102 0 

50 GATGTGTTAA AACTTCTCTT GATAAAGAGG CATTAATTTT ATTAAGCATA ATCTCAGGAG 1080 

TAATAGGTTC CATTTCCATA CGCTTTAACA TACTTAATAA AGGTCTAGAA TTGTGTATCT 1140 
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15 



TTTTCCAATG TTGTGCTGTA ACAACCTCGC CTGTTTCTAT GCGTTTCGTC CATACTAATT 1260 
TGGGCACAAT ACCTTCTGCT GATAATGCCG CAATAAATGG ATTTGAATTT CGTTTTAAAA ' 1320 

ACAACTTTTG TCCATCTTGT TCAGCCATAT ATGCTTCACC AGATGCACCA CCTGCTGAAT 13 80 

CAAGTGTCCA CCCTAATTGA TAAAACTGCT CCAACTCGTC CACCTCACTT TCAATTAGAA 1440 

AATGGCTCTA GAAATAGGTT TTTCAAGAGC CATATATTCT AATTTATAAC ACCATACTGG 1500 

TACAAATATT ATGTCCAGAT AATTATTGTA AATCCTCAAC CAATGCCTAC ATTACACGAC 1560 

TAAATTTAAA TCGTAATGTC TGTCATTGAC ACCATACATT CTATAGTCAC TTACTTGACA 1620 

TATAATGTTA CCGTGTCTAA AACTACATGT TTTTGAATCT CTGTAGGCGA TAAACTcTAG 1680 

TTTTCAAAAT AATTGCTATC CCATTTTCAT GGTTAGCATA AATTTATGAA CTGTAACATT 174 0 

TACGTACTTA GTAAAATATG ATGCACATCA TATTTGTrAC TCATAGAAAA TTTTATAAtT 1800 

20 TTTATCATTA TATTTCAACT GAAAATGAGA AACAAAATGG CACTTTTTAC TAATATGTGT 1860 

TTTCTAAACA ACACTTTTAA GCTTCGTTTT AAATTATAAC ATAATTCACT TACGAAAGTT 1920 

GATAAATTTA AGTAATTTAA TCTAAAAATA TGATGAAAGA ATTTTAAATA CTGTGTGACT 1980 

25 CTATATACTT TTCAAATCCT TCTTGTAGTT GACGTGTAAT TGGGCCAACT TTACCATCAT 2 04 0 

TAACTGGTTC ACCATCTAAT TTAATAACAG GTGTAACCTC AGCTGAAGTA CTTGAAACAA 2100 

TAACTTCATC TGCGTTTTTC AAGAAATCTA CAGTAAACGT TTCTTCTTTA AATGGGATGT 2160 

TATAGTCTTC GGCAATTTTT TTAATTACAA TTCGTGTAAT ACCATTAAGA ATATAGTTGT 2220 

TAATCGGATG TGTATAAATC ACACCGTCTT TAATTGCATA AGCATTACTT GAAGATCCTT 2280 

CAGTTACAGT TtCACCTCGA TGTTGAATTG CTTCAACTGC ATTATATTTC ACAGCATATT 2340 

CTTTTGCTAA TACATTcTCC TAATAAGTTC AAGCTTTTAA TGTCGCAACG TAACCATCGG 2400 

ATATCTTCAA CGGTAACACC ATTCACACCA TTTTCTAAAT GATCATAAGG ACGATCATAA 2460 

CTCTTTGTAT AAGCAACAAT TGCTGGTTCT ACTTCAGGTG TCGGGAAGCT ATGATTCCTT 2520 

TCAGCTACAC CACGCGTTGC TyGAATATAA ATTGCCCCAG TTTCAATTTG ATTCATATCA 2580 

ACTAATTTAC GAGATAGTTC AATTAATTCT TCTACAGAAT AATTTAAATC TAAACCAATC 2640 

45 TCATTGGCAC TACGTwAAAw TCTTTCATAA TGTTCTGTTA CTGTAAATAA CTTACCATTA 2700 

TATACTCGAA TGTATTCATA AATACCATCG CCAAATACGT ATCCTCTGTC GTTGTATGAA 2760 

ACCTTTGCTT CACTTGGACT TACAAACTCA CCATTTAAAA AAATTTTTTC CATATATTAT 2 820 

50 TCCTCCACGC ATAATGAATA AATTGCTTCT AAGTAAATAC TAGTTGCGTT AAATAACTGT 2880 

TTTTTAGTGA TATATTCATT TTTCTGATGC ATTAAATCTT CAGAATCACT AAACATTGCG 294 0 
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TCAGTCATAT CATTTGTTTG ATTTCTATAT GCAGTAACTA ACTTTTGTAC AAAAGGATCA 3060 

TTTTTATCAA CATAATGTGG TGGTTGGACT TTACCTAATT TCACTTCAAA GCCATATTGT 3120 

TGAATCTCAT TTGCAAAACG ATCCATAGCT TTTTCAAATT CAAATCCTTC TGGGTAGCGT 3180 

AAGTTGATAC CGAAAAGACC TGCGTTTTCA TTATCATATG TAATAACACC AATGTTAGTT 3240 

GTCACGTCAC CCATGACATC TGTATGGAAT TTCATTCCCA TCTTTTCACC AAAATCTGAA 3300 

TTAAATAAGT AG CG ATT ACT AAATGCTACA AACGCTTGTG CATTATTATC AAGATTTAAT 3360 

GATGCTAAGA ATTTTAGTAA GTAAAGACCC GCATTCACAC CGATAGATGG ATCCATACCA 3420 

TGAACCGCTT TACCTTCAAC TGTTAAAACT AGAATGCCAC TATCAACAGT ACTATCACCT 3480 

TGTAAATGAT TTTGTTCTAA AAAGTACTCA AAGTCTTGAA TAACATCTGT CATATTTTCT 354 0 

TTAACAAGCA CTCTTGCTTC TGCATGATCA GGTACCATGT TGTAACGTTC ACCAGATTTA 3600 

AAAGTTATTA ATTCATAATC AGGTTCATCT TGATCTTCAG TAAGTTTATT TTGAACTAAA 3660 

TCAAATGTTG TAATGCCTTT TTCACCATGA ATACATGGAA ATTCTGCATC TGGTGCAAAA 3720 

CCTAATGTTG GCATTTCTTC TGTTTTAAAA TAGCGATCCG TACATTTCCA ATCAGATTCT 3780 

25 TCATCCGTAC CAATAATCAT ATGAATACGT TTCTTCCAAT CCACATTCAT ATCTTCTAAT 3840 

ATCTTAATTG CATAATAAGC AGCAATTGTT GGACCTTTGT CATCAAGTGT ACCTCTAGCT 3900 

ATGATAGCAT CTTCTGTTAC AACCGGCTCG AACGGATTAC TATCCCATCC ATCACCAGCA 3960 

GGAACAACGT CAACATGACA TAAGATACCT AATACGTCAT TTCCTTTACC TGCCTCAATT 4020 

CTTCCTGCAA TATGATCCAC ATCATGTGTT GTAAATCCAT CTCTATGTGC AATTTCATAC 4080 

ATGTAGTCTA ATGCCTTACG AGGACCTGGA CCAACTGGTG CGTCTTCTGA TGCTTTTGCA 4140 

TCATCTCTCA CACTTTCAAT TGCTAATAAT CCTTTTAAGT CATTAATGAT TTGATCTTCG 4200 

TATTGTTGAA CTTTTTCTTT CCACATTCGA AATCGACTTC CTTTTTTCTA TAAGTTAAAT 4260 

TCTATTTTAC ATGAAAAGAT ATAAAAACTA CAATAAGATG TCAGAAAATA ATAAAAAGGA 4320 

ACAAAACGAT GCTATTGATA TGACACAAAT CATAAATAGC TGCTTTGTTC CTTTTTTAAT 4380 

TTATATATTT AAAATACACA TATTCAAGAG CTCGAGATAT AAGTCAATGT ACTAGGCACA 4440 

45 CAATTTAATA TTGACAGTAA TTAACCGAAC GAAAATGCGC CCCGGGGCCC CAACATAGAG 4500 

AATTTCGAAA AGAAATTCTA CAGACAATGC AAGTTGGCGG GGCCCCAACA TAGAAGCTGG 4560 

CCAATAGTTA GCTTTCAATA ATGTGCAAGT TGGGGTAAGG GCCCCAACAC AGAAGCTGGC 4620 

50 CAATAGTCAG CTTTCAATAA TGTGCAAGTT GGGGTAAGGG CCCCAACACA GAGAATTTCG 4680 

AAAAGAAATT CTACAGACAA TGCAAGTTGG CGGGGCCCCA ACACAGAAGC TGGCCAATAG 4740 



55 



30 



35 



40 



835 



10 



15 



20 



EP0 786 519 A2 

TAAAGAAATA CGTTTTCTTT AGATATTAGT ATTTCTTATG AATGAGTTTC ACGCATGTAT 4 860 

TCTTCTTTCT ATATGCATAT TAGCTATGAC TAACGATAAA GAACCTGAAA CACTAATAAA 4920 

TGTCCTATAG TTTACAATAT TATATTGGCA GTAGTTGACT GAATGAAAAT ACGCTTGTAA 4 980 

CAAGCTTTTT TCAATTCTAG TCAACCTTGC CGGGGTGGGA CGACGAAATA AATTTTGCTA 5040 

AAATATGATT TCTGTCCCAC TCCCTTATCA TTTCTGTCCT ACTCACATCT TATTCTTTAT 5100 

CAGATAATGC ATTTTTATTC TTTTTTAAAT CTTCTTCAGT GACGATACGT AAATTATTAT 5160 

TTGGTGTGCG CCACCTTCAT CATCAAATTT ACCTTTTTCA ATACTTTCGT CAGTCTTATT 5220 

GTCATATTCG GTAAATTTTG ATTTTTCTTC TTTGAAAAAT GCTTTTGGAT TATTTTTTAA 5280 

TCTATTAGCA TATTCTTTCG GATTTGTTTT TACTTCTTTA ATTGTTTCAT TAGCAATTGT 534 0 

TCCTAATTGC GTCGCTTTAT CCTTAGCATT ATCTTTATAG CTTTGAGGAT CTTGTTTATA 5400 

TTTATTATAT TCcTGcTTTC AGCTTGTCAC GACTATCTTT ACGTGTAACA AGTACAGCTG 5460 

CTACAGCGCC ACCTATACCT AAAATCGCTT TAAATAAATT ACCTTTTGCC ATATCAATCG 5520 

TCTCCCTTTT ATTTATAATT TAATTTGTCA AAATCATTTT CAGTTAATAA ACGATATTCT 5580 

25 CCTGAATCTA AATTGCTGTC CAATTCTAAA TCAGCAATTT TGATACGTCT TAAATGTAAT 564 0 

ACCTCATTTT GAATGCTATG AAACATTCGT TTAACTTGAT GATATTTTCC TTCATAAATT 5700 

GTTACGTGTG ACGTTTGATT ATCAATATAA GTTAATATTG CAGGCTTAAC CTTGCCATCA 5760 

30 GTCAGTGTtA CACCCTCTTT AAAAGCTTGA ATGTCGTCTT CAGTGATAGG ATTTGCTGAA 5820 

ATAACTTCAT ATTTTTTAGA AACATGTTTG TTTGGACTCA TTAATTCATG ATTAAAATCA 5880 

CCATCATTCG TTATCAATAA AAGCCCTTCT GTATCTTTAT CAAGACGACC AACCGGAAAA 594 0 

ATATTTAGAT GTTGGTATTC AGGTATTAAA TCAATAACGG TTTTTGAATG ATGATCTTCA 6000 

GTTGCTGATA TATAACCTTT TGGCTTATTT AACATAATAT AGACATTTTC AATGTATTCT 6060 

ATTAATTCTC CACGAACTGT TATCTTATCG TTTTCTGGTT CTATATGTGT TTTTGGTGAT 6120 

TTAATTACTT GTTCGTTGAC ATTTACAAGG CCTTTTTTAA GTAACTGTTT GACCTCATTA 6180 

CGTGTACCGA CGCCCATATT TGCTAAAAAT TTATCTATTC TCATCGTAAA AACCTAACTC 624 0 

TACGTCTTAA TTTTTCAGGA ATTTCACCTA AGAATTCGTC CGCAAGACGC GTTTTAATTG 6300 

TGATTGTACC GTAAATTAGA ATACCTACTG TAACACCTAA AATAATAATG ATTAAGTAAC 6360 

CAAGTTTAGT AGGTTCTAAG AATAGATTTG CAAGGAAAAA TACTAATTCT ACACCTAGCA 6420 

50 TCATAATAAA TGAATACAAG AATATTTTTG CAAAATGAAT CCAACTATAG CTGAATTTAA 64 80 

ACTTCGCATA TTTTTTAAGA ATATAGAAAT TACATCCAAT TGCAAATAAT AATGCGATAC 6540 
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ACTTGATAAC TACAGAAGCT AAAATAACAT AAACTGTTAA TTTCTGTTTA TCTATACCTT 6660 

GTAACATTGA TGCCGTTACA CTTAATAGTG AAATTAGTAT TGCTACAGGC GCATAATAGA 6720 

5 ATAATAAGCG ACTACCATCA TGGTTAGGGT CATGACCTAA AACAATTGGA TCGTAACCAT 6780 

AGAAAACTGT GAATAATGGT TG TGCCAAGG CCATAATTCC AATACTAGCT GGAACAGTTA 6840 

TAAACATTAA TACACCAATA GATGTTCTAA TTTGATGATG CATTTCATGT AAGCGACCTT 6900 

10 

CTGCAAATGT TTTTGTAATA TAAGGAATTA AACTCACTGC AAAACCAGCA CTTAATGATG 6960 

TCGGAATCAT TACAATTTTA TTAGTTGACA TATTTAGCAT ATTAAAGAAT ATATCTTGTA 7020 

ACTGTGAAGG TATACCAACT AAAGATAAAG CACCGTTATG TGTAAATTGA TCTACTAAGT 7080 

15 

TAAATAATGG ATAATTCAAA CTTACAATAA CGAACGGTAT ACTATAAGCA ATAATTTCTT 7140 

TATACATCTT GCCATATGAC ACATCTATAT CTGTGTAATC AGATTCGACC ATACGATCAA 7200 

20 TATTATGCTT ACGCTTTCTC CAGTAATACC AGAGTGTGaA TATACCAATA ATCGCACCAA 7260 

CTGCTGCTGC AAAAGTAGCA ATACCATTGG CTAATAAAAT AGAGCCATCA AAGACATTTA 7320 

GTACTAAATA ACTTCCGATT AATATGAAAA TCACGCGTGC AATTTGCTCA GTTACTTCTG 7380 

25 ACACTGCTGT TGGCCCCATA GATTTATAAC CTTGGAATAT CCCTCTCCAT GTCGCTAATA 7440 

CAGGAATAAA GATAACAACC ATACTAATGA TTCTTATAAT CCAAGTAATA TCATCGACTG 7500 

ACCAACCGTT TTTATCATGA ATGTTTCTAG CTAATGTTAA TTCAGAAATA TAAGGTGCTA 7560 

30 AGAAATACAG TACCAAGAAA CCTAAAACAC CGGTAATACT CATTACAATA AAACTCGATT 7620 

TATAAAATTT CTGACTTACT TTATATGCCC CAATAGCATT ATATTTCGCA ACATATTTCG 7680 

AAGCTGCTAA TGGTACACCT GCTGTCGCAA CTGCAATTGC AATATTATAT GGTGCATAAG 7740 

35 

CGTATGTGAA CGGCGCCATA TTTTCTTGTC CACCAATTAA ATAGTTGAAT GGAATGATaA 7800 

AAAGTACGCC CAATACCTTG GTAATTAATA TACTAATGGT AATTAAAAAG GTTCCACGCA 7860 

CCATTTCTTT ACTTTCACTC ATTACGAATC TCCCTATCTC ATGTTTATTA AAGTTTTGTA 7920 

40 

AACTAAAAGC TGTTTCTCTG TAAAATCATT TTTCATTATT ATGAATATAT CACAAAACTT 7980 

TATTTCATTG TCGTATATTC AATGAATTAT CATAACAAAA TTATCAACAC ATTGTCATTG 804 0 

45 AATACTAGAT TTTGATTAGA ATATTACGAA ATTTCATATA AACATTATAC TACTATTTGA 8100 

GATGAACATC GCATAACAGT AGAAAAATCA TTCTTATCAT ACACATACAT CTTCATTTTT 8160 

TATGAAGTTC ACATTATAAA TATATTCAAC ATAATTGTCA TCTCATAACA CAAGAGATAT 8220 

50 AGCAAAGTTT AAAAAAGTAC TATAAAATAG CAATTGAATG TCCAGTAACA AATTTGGAGG 8280 

AAGCGTATAT GTATCAAACA ATTATTATCG GAGGCGGACC TAGCGGCTTA ATGGCGGCAG 834 0 
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GTAAACTCAA AATATCTGGT GGCGGTAGAT GTAACGTAAC TAATCGATTA CCATATGCTG B460 

AAATTATTAA GAACATTCCT GGaAATGGGA AATTTTTATA TAGTCCCTTT TCAATTTTTG B520 

ATAATGAATC CATCATAGAT TTTTTTGAGT CTAGGGGTGT TAAATTAAAA GAAGAAGATC 8580 

ACGGGCGTAT GTTTCCAGTT TCCAACAAAG CACAAGACGT GGTTGATACA TTAGTGACAA 8640 

CTATCGAACG CCAACATGTA ACGATTAAAG AAGAAGAAGC TGTTAGTAGA ATCGAAGTTA 0700 

ATACAGACCA AACTTTCACT GTACATACTC AAAATAATAG TTATGAAAGC . CATTCGCTAG 8760 

TGATTGCTAC AGGTGGTACA AGTGTCCCTC AAACTGGTTC AACTGGTGAT GGTTATAAGT 8820 

TCGCACAAGA TTTAGGTCAT ACCATTACTG AGTTATTCCC GACCGAAGTT CCAATTACAT 8880 

CAGCTGAACC TTTCATCAAA TCCAATCGTC TAAAAGGTTT AAGTTTAAAA GATGTTGAAT 8940 

TGTCAGTACT TAAGAAAAAT GGTAAAAAAC GCATCAGTCA TCAAATGGAT ATGTTATTTA 9000 

CTCATTTTGG TATCAGTGGT CCAGCTGCAT TAAGATGTAG TCAGTTTGTT TATAAAGAAC 9060 

AAAAAAATCA AAAGACACAG CACATTTCTA TGGCAATCGA TGCATTTCCT GAATTAAACC 9120 

ATGAACAATT AAAACAACAC ATCACATCAT TATTATCGGA CACACCAGAT AAAATCATTA 9180 

AAAACAGTTT GCATGGTCTA ATTGAAGAGC GCTACTTACT GTTCATGCTG GAACAAGCAG 9240 

GAATCGATGA AAATACCACA TCACATCACT TATCAAATCA ACAATTGAAC GACTTAGTAA 93 00 

ATATGTTTAA AGGGTTTGTA TTTAAGGTGA ACGGGACATT ACCTATAGAT AAGGCATTTG 93 60 

TCACAGGTGG TGGTGTGTCA CTTAAAGAAA TTCAACCTAA AACAATGATG TCTAAATTAG 9420 

TTCCGGGATT ATTTTTATGT GGTGAAGTAT TAGATATACA TGGTTATACT GGTGGTTATA 94 80 

ATATTACAAG TGCACTCGTA ACAGGACATG TCGCTGGATT ATATGCCGGA CATTACTCAC 9540 

ATGCATCAAT GGAATAATAG TATAAAATTT GGTTCGATTC TCTTTAGTAG ATCAACTTTT 9600 

TCATTCAAAT AAAAATGACC TTAATATAAC TGAGTCACTA AAAAGTGTCG TTATATTAAG 9660 

GTCATTTCGT TAATTATGAT TCTTTTTCGT TTTTAGTACG TCTTCTAGCT AACAAAGCCG 9720 

CACCTGTAAT CAGTGCAAAT TCTTTCAATG GTAAATCCAT TCCTTCAGAA CCTGTATTTG 9780 

GAAGTTCTTT TTCAACTTTG CGCGATTCAT GTGTCTCTTC TTTTTTAATA GGCGTACAAA 9840 

CTTTTGGAGC TGGCTGAATT TCTTTTGGTG ATACTTTCGT CGCTTCAGCT GGTAATTTAA 9900 

TTGCTAAAAT TTCATCAACA ATGAATTGCG TGTGTTGTTT GATGTCATTT AATGTCGCAT 9960 

CTTCATCAAT CATTCTATTG CCATCTGCAA CATATTGATC AATTAATACT TTTACTTTAG 10020 

CTAATTGTTC TGGTGTTGCG ATCGCTTTGA ATTTCGCATA TGTTTGTTGA GCAATGTTAT 10080 

CAATTCGCAG TAAGCTATTT TCTTTTTCAG TAATTACTGC TTCTATATCG CTTAATGCAA 1014 0 
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CATCCATTTG TAATTTTAAA GCAGTTATAG CTTTTAATGC ATCAGCCTTA TTACGATTAC 10260 

TTACTTTTCG ATAATTTTGC ACTAAAGCAG TGACGCGTGC AAGATCATCA TTAATCGTTT 10320 

5 TTTCAGCATC TGGCTTTTTA ATAGGATGTA CATCTAAATC ATGTATTGTT TGTAGATTTA 10380 

ATGATGCTGT TTTATCAACT TGTGCATTGC TACGATCTTG ATCAATTTGT CCAATAGCAG 10440 

TGTCATAAAT ATTTTGTAAC TGTGCTAATA TACTATTTCT TTCTTCTACC GTTGCTTGAA 10500 

W TATTCGCTTC AATTGCTTGT TTTTTATCGT TGAATAATGT TGTCAATTGT TCTCGAGCAG 10560 

ACGCCTTTCT GTTAATAACA GGTTCGATTT CACGAATTTC GTTTTTCTCA TCATGCAATA 10620 

AATATGCCAC ATCTGCATTA GTCACTGCAC TAGCAATTTG TTGTTTAGCT TTAATTAACT 106 80 

15 

CTTTTTCAAC TTGTGCTATT GCAATATTTT GTTCTTCATC TGTCGCTTCG TTATTTGCTT 10740 

TAATTAAATT AATTTTATTT GTAGCGATAT TTTGAATTTG TTGTAATGCT GTTGCTTTAA 10 BOO 

2Q CTGTTGTCGC TGGTTTAATT TTTGAAATAA TATTTTGAGC ATTTATACTA TCTTGATTAA 10860 

CTTGGGCAGT CTTATCTGCA TGATTGATCT GATCAATAGC CTGATTAAGT GCTTGTTCTA 10920 

CTAAATGTTT AGCAGCTAGT CTTTCTTCTT CAGTTGATAA ATCGCTTTGA TCGATTAGTG 10980 

25 CATTTTGAGC TTCGGCTTTT ACACCAACAG ATTGACGCGC TGCTGGTTTA ACTTGAACTT 11040 

TAGGTAAAAT CACTTTGATG TTGTCGTTGC CATCAGTCnC AGTnCGATCC ACTTCTGCAT 11100 

TCGTTTTGTT TTGTGCAATG TCATTT 11126 

30 (2) INFORMATION FOR SEQ ID NO: 172: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3660 base pairs 

(B) TYPE: nucleic acid 
3S (C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 172: 

40 

TTGCCCCGCA CGGCGGTGTG nTTCCTAGAA ATAATGAATA TAAAGaGAAA TATATAACAA 60 

CGATTTTGAA TTATGAACCT GGTGATATCG TTACAATCAA ACGTGTGAGA GATAAGACCG 120 

ATTTGCTAAT ATATTTGTCT AGTAAAGATA TTTCTATTGG TAATGAAGTG GAAATTGTAT 180 

45 

CGAAAGATGA AATGAATAAA GTAATTATCA TTAAACGTAA TGATAATGTA ATTATTGTCA 240 

GTTACGAAAA TGCAATGAAC ATGTTTGCTG AAAAATAAAA TAAAGAAGCC ATAAAGATAT 300 

50 CCATGATTGA ACTGATAAAG ACATATGGAT AATTGCTTTA GGCTTCTTTT TTATTAGTTA 360 

ATTTATCAAG TGAGTATATT TGAGTAAAAT ATTCACTGCA TAAAGATTGA AGATAATCCA 420 
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CTGTGGACTC GGACGCTGGA AAGTCAATTT AGCAATCGTC CAACTAGATT GTAGAACTTC 540 

GCCTAATAAT ACACCTAAAA TATATTGATA ACTCATTGTG ACAAGTAGTT GAATTTCTAC 600 

TATATTTTCA TCTTTTAATA TAAAATACAA CATGATAGAA ATTAAAGTTA TAACAACAAT 660 

GGGTGAGCCT TTTCtAGATG TTAAAATTAA AAAATAAATA AATATCAATA AATAGGTAAA 720 

TATAAAGAAA CTAGGTATCT GATAATGGCT CGACGCTAAA CCTATCAATA ACATAATAGG 780 

TGGCATAAAA TAACCACCAA TCGTTGTAAG CCATTGGCCT GCTAGATGTC TAGATTGTGT 840 

AATTGCGAAT CCTTGTTGTA ATGTCTGTTG TCGCTCTCGT GGACTTGTTA CAATGACTAA 900 

ATCTTTTGCA CGGCCACCAG CGAGTTTATT AAACAGTACA TGACCAAATT CATGTGTTAA 960 

AACAGGGATA TAGTTTAAAA TGACATCTAA ATAGTTCAAA ACAGGCTTAT GTCTATATTG 1020 

ATGAATAGCA ATATAACAAG CTGCAACAAT AACGATAATG TATATATTAA GTTGAATTGT 1080 

CGTATTAAAA AAGTTTGATA AATAATTCAT TGTTAACCTC ATATAAGATA TTAATTTAAA 1140 

GTTTGCTTAT CACTTATTAT AAATGATATT GGCATCAATA GCGTTAGACT TTAGACTTAC 1200 

CTTAGTTAAA CTAATTTTAA TTTTTGAAAA GGTGAATATG TGTTAAAATA AAGCAAAATC 1260 

25 ATTTCGATAT AAATAGGATG AATATAAATA CTGTTAATAT TGATTACACT AACATAATAA 1320 

TGAAATAAGA TAGGAGATTC CTGTTATGAC TGTTGAAGAA AGATCCAATA CAGCCAAAGT 13 80 

TGACATTTTA GGGGTCGATT TTGATAATAC AACAATGTTG CAAATGGTTG AAAATATTAA 1440 

30 AACCTTTTTT GCAAATCAAT CAACGAATAA TCTTTTTATA GTAACAGCCA ACCCTGAAAT 1500 

AGTGAATTAC GCGACGACAC ATCAAGCGTA TTTAGAGTTA ATAAATCAAG CGAGCTATAT 1560 

TGTTGCTGAT GGGACAGGAG TAGTCAAAGC TTCGCATCGT TTAAAGCAAC CTCTAGCGCA 1620 

TCGTATACCT GGTATTGAGT TGATGGATGA ATGTTTGAAA ATTGCTCATG TAAATCATCA 1680 

AAAAGTATTT TTGCTAGGGG CAACTAATGA AGTTGTAGAA GCGGCACAAT ATGCATTGCA 1740 

ACAAAGATAT CCAAACATAT CGTTTGCACA TCATCACGGT TATATTGATT TAGAAGATGA 1800 

GACAGTAGTG AAcGnAnTTA AACTGTTTAA ACCTGATTAC ATATTTGTAG GTATGGGATT 1860 

CCCTAAACAA GAAGAATGGA TTATGACACA TGAAAACCAA TTTGAATCTA CAGTGATGAT 1920 

GGGCGTAGGT GGTTCTCTTG AAGTATTTGC TGGGGCTAAA AAGAGAGCGC CTTATATCTT 1980 

TAGAAAATTA AACATTGAAT GGATATATAG AGCATTAATA GATTGGAAAC GTATTGGTAG 2040 

ATTAAAGAGT ATTCCAATAT TTATGTATAA AATAGCCAAA GCaAAAAGAA AAATAAAAAA 2100 

50 GGCGAAATAA TCATGATGAC AAAAATAAAA CCGAGGAAAT CCTTAAATGG AGATTCTCGG 2160 

TTTTTTCGGT TTATTTAATA ACGAAGCGGG ACTCATCGAG TTTGTTTCTA AATTCTTTTT 2220 
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CATCAAGTTC ACCGTAATCT TTTAACTTTC CGCCTTCAAT CCAAGCAATC TTAGTACAAA 234 0 

ATTGTCTCAC TTGTCCTAAG TTATGACTAA CGAAAAAGAT GGTTTTGTTT TGCTCTTTAA 24 00 

5 ACTCGTAAAT TTTATCTAAA CATTTTTGTG CAAAAGTTTG GTCACCTACA GATAAAGCTT 2460 

CGTCAATGAC TAAGATATCT GGATTAACTG TGATATTAAT TGAAAAACCA AGTTTTGCAC 2520 

GCATACCACT TGAATACTTT TTAACTGGTT GATAAATAAA CTCACCAAGT TCACTAAATT 2580 

70 

CAATAATCTT AGGTGTCATC GCTTTAATTT CTTTTCGCTT AAAGCCCATA CATAACATTT 2640 

TAAATTCGAT ATTTTCAATC CCTGTAAGTT GTCCACTCAA GCCAGCACTA ATTGCGATAA 2700 

CGCTGACTTC ACCATTACGA TCCACTTTGC CAACAGTAGG CGACAAAGAA CCGCCAATGA 2760 

15 

TATTGCTCAA CGTTGATTTG CCGGAACCAT TGATGCCAAC AAGCCCTATG ACGTCACCTT 2820 

CATATGCTTT TAAACTAATG TCATCTAAAG CGAAAAATGT TTTGTTTTTA TGTTTGGGAA 2880 

20 TGAGCGCATC TTTCATACGT TCTTTATTTG TACGATAAAT ACGATATTCT TTTGTTACAT 294 0 

TTTTAATGTT TACCGAAACG TTCATTTGTA GACCTTCCTT ATTCACATTT ATCTAGATTA 3000 

TAATATACTA CTCAACAGTT GTTAAATTTT AAAACCTGTT GTAAAGTGTA TAGAAGATTT 3060 

25 TGTTATTATC AGAGTGGGTG TTTTGACACA AAATGTTAAT CATCAATGAT AACAATGATA 3120 

TTTAAAAACT AAACTTATTT CAACTTACAT GATTGTATAC TATAATGTAT TTGTAATAAA 3180 

CTAATATTTT AAAGAACTAG ACAATAATTT TGATAGCATC CATGTATAGT GATAGTATTT 324 0 

30 

ACAACAATTA TTATAATACT ATTTAGTTAA GTAGAGAAAT AGTTAAACAT TTGAAAGTGT 3300 

GGTTTAATGG AATGTCAGCA ATAGGAACAG TTTTTAAAGA ACATGTAAAG AACTTTTATT 3360 

TAATTCAAAG ACTGGCTCAG TTTCAAGTTA AAATTATCAA TCATAGTAAC TATTTAGGTG 3420 

35 

TGGCTTGGGA ATTAATTAAC CCTGTTATGC AAATTATGGT TTACTGGATG GTTTTTGGAT 34 80 

TAGG&ATAAG AAGTAATGCA CCAATTCATG GTGTACCTTT TGTTTATTGG TTATTGGTTG 3540 

GTATCAGTAT GTGGTTCTTC ATCAACCAAG GTATTTTAGA AGGTACTAAA GCAATTACAC 3600 

40 

AAAAGTTTAA TCAAGTATCG AAAATGAAcT TCCCGTTATC GATAtACCGA CATATATTGT 3660 
(2) INFORMATION FOR SEQ ID NO: 173: 

45 <i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 13868 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

so 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 173: 
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ATTAATCACT TGTTGTGTAG AGTCTTGTCC GTTTTGGTTA TGATTGTTAG CCATGATATA 120 

CCTCCCTTAC AACACTCGTG GACCAGAAGT TTTCTGATCT CTCACATTAA CTTCTAACTT 180 

ACGTACTGGC ATTTCTGTGA AATATTCTAC ATTCTTTTTA ATATCCGAAC GAATTGCTTC 24 0 

AGTTAAAGAT TGAACTTGAA CATTATTTGG TACGAAAAAG TCAGTTTTAA TGTCGATATA 300 

AGATTTATTT TTTTTGTTAT ATAGTTTCGC AACTACATTT GGTTGTCTTA CTTGATCATA 36 0 

TTTTGCAACC GTATCGAATG CCGTCTTTTC AACAGCTTTA CGAGATACGT AAACATGACC 420 

ATCATCGAAG TCTTTGTATA ATCCAGGTTT TCGATGCGTA GGTTTGAAGA TACTAAATAC 480 

TAATATAAGA CCTATTAATA TCAATAGTGC AGCAAGTGAA ATAAGTAATG GTTGGAACCA 540 

TTCAAATTGA AGGAAGTAGT CTTGATATTC AGTTATACGT CCATCTTGGA TATACATGAA 600 

TAACAGGAAC CCCACGaTTA CTACTATTAA TAAGCCAAGG ATAAAGTTTT TAAGTCGTTT 660 

CACCCCTAAC GACACCTCCT TAGTTAAAGT TAATTTAAAA ACATATTAAA TATGTACCCA 720 

TCAGTTTTTT TCTTAAACAT AATAAATTAA TAACTTTAAA TTTATTTTTA ATATATAAGA 780 

TGAAGTACCA TTTAGTAATA TATTCCCTAG TTTTTGTAAA TAAAACCTCA TTATTAATTA 840 

25 ATTyTCGTCA ATATGTTTTG AAGAACGATA TTCTAAAATA TCTGGGTCAC GATGTTTAAT 900 

TAAAACCTTA TTACTATTTC TCGGTTTCTC CTCACTCAAA GATTTTATAA GCGACCATAT 960 

CATCGCTATA ATGACCACGG AAAATGGTAA CGCAGCAATG ATTAATAAAT TTTGAATTGC 1020 

30 

TTGAGTACCA CCTGTGTAAA TCATGATGAT TGCAAATAAT GCCATAATGA TACCCCAACT 1080 

CACTTTGACA AATGACTTCG GATTAATATC ACCACTTGAA CTCAACATAC CTAAAACATA 1140 

AGTTGCCGAA TCCGCTGATG TAACAAAGAA AATCATAATA ACAAGTAAAG TAATTAAGCT 1200 

35 

TAATACAAAA CCTAGCGGAT AATGTTGTAG CGTCGCAAAA GTTGCTGTTT CTGTCGCAGC 1260 

TTTAGCAATA TCGGCAATAT GATTATCTTG TAAGTAAATT GCTGACGCGC CGAATACCGC 1320 

AAAGAATATA AAGCAAACTA ACGCCGGGAC AAAAAGTACA CCTAGAATAA ATTCTTTAAT 1380 

40 

CGTACGTCCT TTTGACACAC GTGCAATAAA TATACCTACA AATGGTGCCC AAGATATCCA 144 0 

CCATGCCCAG TAAAAGATTG TCCAATTTTG TAACCATTGG AATTTTTGAC CACCTGTCGG 1500 

45 AATGCGTAAA CTCATACTAA AGAAATTTGC AATATAATTA CCTAGACCAT TCGTAAATGT 1560 

ATTTAAAATG TATAGCGTTG GCCCAACAAT AAAAAGACCA ATAAGTACTA CAAAAGCAAG 1620 

TAACATGTTG ATATTACTCA ACGTTTTGAT ACCTTTATCG ATACCTGACC ATGCTGACCA 1680 

50 AGTAAATAAT ATGGTTGCAA TGACAATCAA GATTACTTGC ATCGTGAAGT TACTCGGTAC 1740 

ATTAAATAAA AAATGTAAAC CTTCGTTTAT TTGCAATGCA CCGAAACCTA' ATGTTGCAGC 1800 
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CATTGCCTTT TCACCTAATA AAGGCGTCAA TGTAGCGCTG ACTAAGCCAG GATATCCTTT 1920 

ATGAAAGCTA AAATATGCAA ACACTAGCGC GACAATACCA TAGACTGCCC ATGCATGAAT 1980 

CCCCCAATGG AAAAATGAAA ACTGCATTGC ATCATTAATT GCAGATTGCG TGCCAGCTTT 204 0 

ATGAATAGGC GTTAATTTGA AGGCATGACT GATTGGTTCT GCCGTTGTCC AGAACACAAG 2100 

TCCTATTCCC ATACCAGCAC TAAATAACAT AGCAAACCAA GACGGCAATG AGAATTCAGG 2160 

ATCTTCGCCT TCTTCACCTA ATGTAATGTT TGCGTATCTC GAAAATAAAA TATACACACA 2220 

GACAAATAAA ATAACTAAAA CGAGCAATAA ATAATACCAA GAAAAATGTA GCGCAATAAA 2280 

TGTAGTAATG TTTTGCGTGA GTTTTTCTAA CTGTTTCGGA AATATTGCTC CAAAAGCAAC 2340 

AAATATCGTA CATATCACTA AAGATACCCA AAACACTAGA CTTACTGATT TATTTTTCAT 2400 

AAATACAAAC CCTTTCTGTG TAATGGTAAG TTCATACCCA TAACTGCAAC ATTTTAATCA 2460 

2Q TTTGTAATTT TATATAGACA CAATTAATAA TGCCTCATCT TTTAAAAATG ATATATAAAA 2520 

CACACTCAAA TTATTTATCA TTGAGCAACA AAGTATTTTA TTGTATTTAA GTAATGCCTT 2580 

TCTAGTGCAT TATTGATTTG ATACCTGCAA AGTTGCCATA TTTCCGTTTA GAATCAATAG 2640 

25 TCGCTAGACA CAAAAAATAA GTCGCCTATA CAGTATTTTC TGCATAAGGC GACTTTACTT 2700 

ACTAATCTAT ATATTAATTA CTAATTTTCC AATCATTGAT TGTTTTTCCA ACAATTGATG 2760 

TGCTTGATAT AAGTTTTCAG GTGATAAACC TTCAAAAACT TGTGTCGTTG TTGGTTGGTA 2820 

ATGCCCTGAT TCTATATTTT TCGTAATATC TTCTAAATAC TCATGTTGTT TAATCATATC 2880 

AGGCGTTCGA TGAATTGGAC GCGCAAACAT AAATTCATGT GTAAATGTTA TACTTTTTAA 2940 

TTTTAATGCA TTTAAATCTT GATCTTCATT AAAAGCTACG ATAGTCGTAA TATGCCCTAA 3000 

TGGTTTTATC AGTTCAATCA TAGTATTGTA ATACAAGTCT GTATTATAGG TGCAAAATAT 3060 

ATAATCTACT AATGGAATTT CTTTAAATTG ACGCACTAAA TCCTCTTTAT GATTCAATAC 3120 

GATATCTGCG CCCATCTTTT CACACCACTC TGTTGTTTCT TGTCGTGATG CTGTTGTAAT 3180 

GACAGTTAAA CCATAGCGTT TAGCAATTTG AGTGGCTATA CTGCCTACAC CACCGGCACC 3240 

ATTAATGATT AAGACAGACT TCCCTTCGTT TTCAGCAGGA TTCGTAGAAA TTTTAAATGT 3300 

45 ATCAAAAAAC GTTTCATATG CCGTAATACC AGTTAGCGGT AGACTAACCG CTTCATTAGC 3360 

ACTTATGTTG TGTGGTGCTT TTGCAACTAT AGCTTCTGAC ACCAATTGAT ATGTCGCATT 3420 

TGATCCTTGT CTATTTGGCG ATCCAGCATA AAATACAACG TCACCCGGAC TAAATAATGT 34 80 

SO AACGTCTGGT CCGATAGCTT CAACAGTACC AATAGCATCA AACCCAAGTA CACGAGGTGC 3540 

TTGAGTGACT TCCATTTGTC GTTGCTTTGT ATCTACAGGA TTTACACTAA TGCTATTTAC 3600 
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ATTTCCTTCT TCCAATTTAA AGGGCTTCTC AAATCCTATC ATTTTCATAT CGTTTCACCT 3720 

CATTTATGAA CTTATTTCTT ATTATACAAA ATAGAAGCCA TGTGTGCTTA TATCGCAGCA 3780 

TCATGACTCC TTTTTCATTT GAATATATAA ATAATTACAG ACGACTTTCG TATTAAATTT 3840 

TAGACTTATT TCTACCATGT TGCTGAACAA ATTTACTTTA GATAAAAAAT TATTAAATTT 3900 

TGGTCAATTA ACAAAGTTAG TTTGTTAAAA CGTgATACTT TATTATTCCG TTACTTTAAT 3960 

AACTTGTTTA CCAAAGTTAT CGCCAGTaAA TAAATTTTTA AATGCATGTG GCGCATTTTC 4020 

AAAACCATCT TCAATGGTTA CTTGTGACTG AATTTTACCT TCTTGAACCC ATGTTGCAAG 4080 

CTGTTCACTA GCTTCTTTAA AAGCATTAGC GAATTCACTT ACCAAGAAGC CTCTCATCAT 4140 

TACTTGCTTC TTAATAAGCG TACCTTGAAT ACGTGGTCCG ATATCGGCTT CAGGATGATT 4200 

ATATGACGAA ATTGCGCCAC ATACTGGTAC ACGTGCAAAA CGATTTAAAT GCTTAAATAC 4260 

2Q TTCATCGCCA ACTGTTCCAC CAACATTTTC AAAATAAACA TCAATACCAT CTGGTACTGC 4320 

TTGTGCTAAC GCTTCTGCAA AATCCTCTTT CTTATAATCA ATACCAGCGT CAAAGCCCAG 4380 

TGTCTCTGTT AAATAATTTA CTTTTTTGTC GCCACCCGCA ATACCTACTA CACGGCAACC 4440 

25 TTTAATCTTA GCAATTTGAC CTACAACTGA ACCTACAGCA CCAGATGCAG CTGAAACCAC 4500 

AACAGTATCA CCGGCTTTAG GTTGTCCAAT ATCAAGCAGA CCATGATATG CTGTTTGTCC 4560 

TGGCATTCCT AAAACACTTA AATATAAATC AAGTGGTACA TCTGTCGTTG GAACTTTAGT 4620 

AATTTGATCC GCTTGGACAT GATTAATGAT TCGCCAAGGC AACATACCTA CAACGACATC 4680 

TCCTTTTTTA TAATCtGCGA GTGTCGAATC AATTACTTTT GCAACGACAT GGCTAACAAT 4740 

CGGTTTACCA ATTTCAAAAG GCTGTACATA CGAATCTGCC TTAGTCATAC GTCCTCTCAT 4 800 

ATATGGATCC ACTGAAATAT ACAGCGTTTG TACAAGTACA CCATCGCTCT CAAGTTTaGG 4 860 

CGTGfcAATC TCTTCaATTT TGAATGTATC CTCTTGAGGC ATGCCkTCTG GTATTTTGTT 4 920 

AAAAAGAATT TGTTTATTTT GCATCATTAA TCACCTTTCT TTATTTGAAA CTTTTACTTA 4980 

TTTGTTACTT AAGCGTTAAG TTTGAATTGT GTCtTCGTGA TGTCTGTATG CAAATACATT 504 0 

CTTAGTTGTT ATATTTTGAC TTAAGCACTG ATTCATTCAT GTAACTTCAA CCACATTATA 5100 

45 TTTGCTATAA TCATAAATTT AAAATGTTAC GACTTAGACA TTTTATGGAA ACTCTCAAAC 5160 

AATAGATAAT TTTTGAAAAG CTCTAATATT ACAAGCTTTT TTGCCCCAGA AAAACTAGCA 5220 

GTTGCTTTAT TTTTTCCATA AGAAGTCGAT TAACTCATTA GCAACATTTT CATTCTCATG 5280 

50 AAGGTGACTA TGTTGTGCAG GCTCACCTTC ATATTTAGAT TCTCGATAAC TTTTCGGACT 5340 

ATTTCCCAGT AAATATTTTA ATGATTTCGA AGAACTATTA GACACTCTGC CGTCTGAATG 5400 
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ATCTTTTAGC ACGCGTAATT GCTGATAAGG TTGATTCATT CGACTTGGTT TACCATCTTT 5520 

ATCAACTGTA ATTTCATTGA CATCTTCATT CATATTTAAA ACACCATTAA ATGTCCCTGC 5580 

AATATTCACT TGTTTGTTTA ACTGTGGCAG TGACTTGTCG TTACCATATG TCATCATATA 5640 

TTGTGCAAAT GTTAAGTTCC CCATTGAGTG ACCGACAAAG TTGAATTTAT CGAAATTGTA 5700 

TTCAGATTGT AACTTAGTCA GTACATTTTT AAACCACGCA GCATTCTTAT CCAAATAGCC 5760 

TTGTCTGTTA TTTTCAAGTT CAATTTTCAC AATAGGATTC ACTGCATCTT TTCTTAGTTT 5820 

CCCTTTAAAT GTCACTGCAC CATCCTTTGA AACGTAAGCA GTGATGATAT CTTTAGTTAC 5880 

CCCTCTTTTT TCTGCTTGCT TCACCATAAA CTTTTCAGAA TTGGCACTAC CACCAAATCC 594 0 

ATGTAAGAAC AATGTTGGAA TTGGCTTTTT AACAAATTGC TGTTGTTGTA TTTTAAATGT 6000 

TTGTGCCTGT CGTTGACTAA ACACCACCAT AATAATAGAG CCTATAATAA TAGCGACCGC 6060 

TAACAATGTC GTAATAATTA CAAAAATTTT CTTCACACTT TTAACTCCCA TTCATGTCTT 6120 

TTATATAAGT ATAAAGGATG TGATTAAAAA TGTCCTTTAG TTGATTTTGA ATACATCATT 6180 

AACTTTTAAG ATGACTTTGG AAAGTTGTCC GTTAACGTTT GTTAATTGAT TGCTTCTTTA 6240 

25 GCTTTCAATG GTGTGTCACC CATTGATTAA TATATAAATA TGTATATGCA TGTTTAATTT 6300 

ATCTCTTTCT ATAAATAAAG ACCTACCAGC ACTCGACTGA TAGGCCTTTT AATATCTATA 6360 

ATTATTTAAT TTCTTTTGTT TCGGCTAACT CTTTGTACCA ATAAGCACTT TTCTTAGGAT 6420 

30 AACGTTCTTG AGTCTCAAAA TCGACATAGA ATAAACCATA TCGTTTTTCA TAACCATTTG 64 80 

ACCAAGAGAA CACATCCATT AATGACCAAA TAAAGTAACC TTTAACATTT GCACCATCTA 6540 

TAATAGCATC TGCAATAACG TTCAAATGTT GTCTTACATA ATCAATACGT GCATCATCAT 6600 

GAACTGTTTT TTCAGATTCA ATAAATTCAT CTTTATATCC TAAACCATTT TCAGTGATAT 6660 

AAAXCTTATG aTAGTTAGGA TAATCTTTAA CAACACGCAT GaTTTGATCA TATAAACCTT 6720 

GAGGATAGAT CATCCAGTCC CAGTCTGTGC GAGGTACGTC GACATCAAAT TCACGTTGTC 6780 

CGACACCTTT AAGTTGGTAT TTAGAACCGC CTTTATCACC TGTCGCATTA TGCGTGATTT 6840 

CAGATTCTCC ATCGTAACCT CTCATCCAAT CACTCATGTA GTAATTGATA CCTAAGAAGT 6900 

CGTTTAAATC TTTGGCTGCA TCTAAAATGG CATAATCTTC ATCTGTAATG TTTAATTTAC 6960 

CGCCATTAAC AGATAAGATA TGTTGCACAC CTTCCATCGT TTCACGAGAA TACTTACCTA 7020 

AATATGTTGC ATCTAAGATG AATTTATTAT GGATGATATC TTCTAATTCT GCTGCACGAA 7080 

SO CATCTTCAGG ATTTGATGGA TCGAACGGAT ATTTTGTTGG CAATGCGTGT ACAACACCAA 714 0 

TTTCTCCTTT GTATCCGCCA TCTTTAAATA ATTTTACTGC TCTAGCATGA GC CACCATCA 7200 
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CTACTAAATA 


TTGACCATCA 


CCAATAGGTC 


CAATTTCATT 


GAATGTAGTC 


CAATATTTTA 


7320 




CTTCTGGGAA 


TTCTTTAAAA 


CAATATTCAG 


CATAATCTAC 


AAAGTAGTCA ATCGTTTTAC 


7380 


5 


GATTTAGAAA ATCGCCATCT 


TTGTGTAaCA 


CTTCTGGTGT 


ATCAAAATGA 


TGCAATGTTA 


7440 




CAAATGGTTC AACATGACGT 


TTATGACACT 


CTGCAAATAA 


CTTATGGTAA 


TACTCAACAC 


7500 


10 


CTTTAGGGTT 


AACTTCGCCA 


TATCCATTTG 


GGAAGATACG 


AGACCATGCA 


ATTGAAATTC 


7560 


GGATACCATT 


AACACCGAAT 


TTTTCACTTA ATTCTAAATC 


CACTGGATAT 


CTGTTATAAA 


7620 




AATCACTOGC 


TGGTTCTGCA 


GTGTACCAAT 


AGTTTTCTTC 


TAAATACGTA 


TCCCATGCTA 


7680 


15 


CGCGACCTTT 


ACCATCCGTA 


TTTGTCGCAC 


CTTCTGCTTG 


ATATGCTGCT 


GTTGCTCCAC 


7740 




CAAAAATAAA 


ATCTTCAGGT 


AATGTTTTAG 


TCATATGAAA 


AACTCCTATT 


CTTAATTTTC 


7800 




AAATTGTTGT 


TGAACGAAAT 


CAAGGGCTGC 


TTGGCCATCT 


CGTGTCAATT 


TGATATATTC 


7860 


20 


AGCACCTTGA 


GTCTTCGCTA 


ATTTAATACC 


TAATCTATCT 


GTATCTTGCT 


TAATATCTTC 


7920 




ATAGTTAGAC 


GCAACTTGTG 


G CGCTAAAAT 


GATTAATTGG 


TACTCTTTCA 


TAATGTCCAT 


7980 




ATGTGCGCCA 


TATCCGCCAG 


CTGCCGCTTT 


CACTGGCACA 


TGATATTCTT 


CAGCTGCTTT 


8040 


25 


ATTAAGTGCA 


TTGGCTAATA 


ATCCACTTGT 


ACCACCACCG 


GCACAAAGTA 


CTAAGACATT 


8100 




TGTTTGTTCT 


GTGATATTTG 


AAGCTTTAGC 


TGCATCGTCT 


GATACACCAC 


TTGCCGCTAA 


8160 




AATTGAATCA 


GCTTTTTTCG 


TATCAAAGTT 


TGCTGCAACT 


TTTTCTTTTA 


AATCTGAATT 


8220 


30 


ACTTTCTTTA 


CGTCCTTCTT 


CTTCATCAAG 


AATTTCACTA 


TCATAAACTT 


TTAGGAATGG 


8280 




GTAGTAAATA 


ATAATATCTA 


CAACAATCAA 


AGTAATAGCT 


AGTACGAATG 


ACCATAAACC 


8340 


35 


AAAACCTGTA 


CCCATGATAA 


TGCCCAATGG 


ACCTGGTGTT 


GTCCAAGGTA 


AATTCACACT 


' 8400 


AAAACTATTC 


ATTCCTAACA 


CTTCAACGAA AAGTTTGAAA ATCCATACGT 


TAACAATTGG 


8460 




TGCTAATACA 


AATGGAATAA 


AGAACACAGG 


ATTCAATACT 


AGTGGTGCAC 


CAAATAAAAT 


8520 


40 


TGGTTCGTTT 


ACACCAAAGA 


ATGTTGGTAC 


AACTGATGCA 


CGTCCAATCG 


CTTTGTTTCG 


8580 




TTTAGATTTC 


GTCATCCACA 


TAAACATGAA 


CGGGACGACC AATGTTGCAC 


CCGTACCTCC 


8640 




AAATGTAACG 


ATAAACATTT 


GTGTACCTGA 


TGTAATAATT . 


TTATCTGCGT 


GTTCTCCAGC 


8700 


45 


TTGAAGCAAC 


TTGAAGTTCG 


CTTCGATATT 


CGCATATGTA 


ATGGCTGCAA 


TTGCTGGCTC 


8760 




TACAATTGAC 


GGACCATGAA 


TACCTACAAA 


CCAGAATAAT 


GCAAAGGCAC 


CAAAGATAAT 


8820 




TGTGACACCA 


ATCCATCCAT 


CTGCTGCTGT 


AAATAATGGT 


TCGAATAATT 


TTAAAATACC 


8880 


SO 


TTCCGCTACA 


TTTGATTTAA 


AGCTGTTGCG 


AATGACTAAA 


TCTAATGCAT 


AAAGAATGAT 


8940 




GATTACCGCT 


GAAAATGGAA 


TTAAGTCCTT AAATACTTGT 


GAAATATTCG 


GCGGTACTTC 


9000 
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AAATGCTGAT AAGAATGCTG TTAATAAACC TTTAGTTCCC ATAAATGCAC TTAAGAATCC 9120 

ACCATCTTTG GCTGGATCAG AAGCTAAGAA CAAGAATCCA CACATCGCTG CTAGCATTGT 9180 

5 AGAAATAAAG TTAATTTGAT TTGTACTTTC TAGCTTACGG TTAAATGAAT CTGTTAAAGA 9240 

TTTCGCTGTC GTTCCTGCTA CTAAAAATGC TACAAGCCCC ATCGTATAGT TATATGGTTT 9300 

CATTAAAATG GCTTCCATGC CTTTATCCCA TTTAAAACCA AATATATTTG GCACATATGC 9360 

10 

AATTAATAGA AAGATACTTG AGAATAAGAT GACAGGCATT GCAGAAATAA ATCCATCACG 9420 

GATGGCTCTT AAATATATGT TACGTGATAA TTTCTCGAAA AATGGCTTCC CTTTTTCAAT 9480 

TTGTGCGATC AATTTTTGCA TCATTGTCAT CACCCTCTTT TATAAAATTC TAATAAATGC 9540 

15 

TTCATTAAAT CTTTCAGTAA AATTGTTGTC ATTAAATGAT CTTGACCATG CAT CAT CG TT 9600 

ACACTGTATG CAATATCATC ACCTTGCGCT TCTTTAGCCA ACAGGCTTGT TTGTGCTCTA 9660 

2Q TGCGCTTCCG CAATGCAATT GTTTCCTTCT TCAATCAGTG CATCTGCTTT TGCAAAATCT 9720 

CCAGCTTGAG CTGCTGTTAA TGCTTCTAAA AACTTAGAAC GTGCATCCCC TGCAAATGCA 9780 

ACAATTTCAA AACCTAATAA TTGGACTTCT TCTCTATTCA TAGCATTAAT CCCCTTTTAA 9840 

25 ACTTATTTTC TTTGTTTCCA AGATGTCGCA GTATCTTTTA ATACTTTATT TAAGTCATCA 9900 

ATATTTTTGA AACCAGTTGT ACGTAACCAT TCACGAGCAG CATCTTCACC TTGTTCAATG 9960 

TATACTTGAA CAGCACCAGA CCATGTAGCA CGGCCACAAA GTACCCCGTT GAATTTAGCA 10020 

30 CCAGCTTCGT GAGCAAATTT TAAAGTTTCT TGGAATAATT CCGCAGAAAC ACCAGCACTT 10080 

AAGTAAATGT ATGGTAAATG AGTTGCTGCA TCTTGATCTT TAAAGTGTTG TGCCGCTTCC 1014 0 

TCTTTTGTAT AAACCACTTC ACCTTCAGCA AAGCCTTCTA CATATTTCAT GTTTACTGGT 10200 

35 

ACTTCAACTT TCAATACATC AACGTTAAAG CGTGGTTCTG AGAATAATTT CATTGCTTCG 10260 

TTAACCTTTC TAGGCTTAAC TTTTGCGAAT TcAACAcTAC CGTTATcAGG AATGTTGTCA 10320 

TCGTATGTTA ATACTTCTAA AAAGAATGGA ATATCTTCTG CAACACATTC TGAACCGATT 10380 

40 

CTTTCAATGT ATGCTTTCTT TTGAATGTTA ATTTCTTCAG CATCATCAAC ATCATAGTAA 10440 

AGTAAGAATT TAACAGCATT TGCGCCTTGT TCTTTTAAAC GTTTTGCAGA CCACTCTACT 10500 

AAACAGTCAG GTAAACGACC TTTAGCGTTT ACGTCATATC CAGTTTTTTC ATAAGCAAGT 10560 

45 

AATAATCCAC AATCTTTGTT ACGTGCATCT GAAGCTGGTA AACCATATTC AGGATCTAAT 10620 

AAAATTGAAG ATGCATATTG TGTTAATTCT TCCGCAACTA ATACTTTTAA TTGTTCAATT 10680 

SO TGAGCTACAG TTGGTTCTTC AGTTTGATGT TTTGCCATCA TGCGTTTTAA AGCACCACGT 10740 

TGGTCAAATG CTAATGCAGA AATGATACCT TCGTTGTTAC TTAATTGTTC AATTGATGCG 10800 
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TCATCATAAT 


TATTTAAATT 


GACATAACCT 


GTTTGTGCTT 


CTTGTGCATT 


CAGCATGCCT 


10920 




AAAGTATTGG 


CTlTlTrrAG 


TAAATCGTGG 


TCGTTTTCAT 


GATTAAGAAT 


TGCTGAAGTA 


10980 


5 


ATTCCAGCAA 


CTGTAGAATC 


ACCTGAACCA 


ACCGGATTTA 


ATACACTTAT 


TGTCGGAATA 


11040 




TTCACTCTAT 


AGAATGTATG 


ATTGTGCTTA 


GCGAATGCAC 


CTTGTGCACC 


TAAAGACACA 


11100 


10 


ATAATCCACT 


CAATCCCTTC 


GAATAAGGGT 


TGTGACACTG 


CCTGTTTCAA 


ACTTTCTAAA 


11160 


CTTTCATCAA 


GTGGCTGGTT 


AAGCAATTGA 


TATAGTTCAG 


AAATGTTTGG 


TTTAATGACT 


11220 




GTAGGTTTGT 


ATGGATTTTC 


CAAAACTGTT 


TGCAAAGTtG 


CACCCGAGCA 


ATCTAATATC 


11280 


15 


ACAGGCACAC 


CTTTGTTTTG 


GCATCGTTCA 


ATGATTTGTG 


CATAATAATC 


TTGATTTAAT 


11340 




CCTTTAGGTA AGCTACCTGA AATAGCAACT GCTTCAACTT TTTCTAATAA TTGTTCAAAA 


11400 




TGTTTAATAA ATCCTGCAGC 


CTCTTGATTA 


TCAATCTCCG 


GTCCCTGCTC 


TAAAATTTCT 


11460 


20 


GTTTGTTGCC 


CTTCATGTAA 


AATTGCAATG 


CAGTTTCGTG 


TTTCACCCTT 


AATGTTATAA 


11520 




AATGCATGCT 


TGATGTCGGC 


ATGATCTAAT 


TTTTTAGCAA 


TAAATTGACC 


T AATTCAC CG 


11580. 




CCAATAAAAC 


CACTCGCAAG 


GACTGGCTCA 


C CTACTTGCG 


CAAGTACTCT 


TGTTACATTT 


11640 


25 


AAACCTTTAC 


CACCAGCTGT 


TTTACTTACT 


T CTTGAACAC 


GATTAACATC 


ATCTAATTTC 


11700 




AATGCTGTTA 


ATGGGTATGA 


AATATCAACG 


GATGGAT1 1 A 


ATGTTAAAGT 


TAAAATCATA 


11760 




TGTGTCGTCC 


CTTAATCGTG 


GTATTCGCCT 


CTGTCCCATT 


TTTCTAAGAA 


TTCATCAAAG 


11820 


30 


AAATGTGGAT 


CAGCTTGATC 


TGCATTGCTT 


GTTTCTAAAT 


GTTTAATTTT 


AGCGATTAAT 


11880 




TTTTTGTTCT 


CTTCAGTTGG 


TTTATATTCA 


GCATTAATAA 


ATG CATCGAT 


AATATCGCAC 


11940 


35 


ATTAATAACT 


CACCTATAAT 


ACGTCCACCG 


AAGCCAATAA 


CGTTCGCATT 


TAATTCTTCT 


12000 


TTAGCGTATA ACGCTGATGT 


CATATCACGT 


ACTAGTGCTG 


AACGAACGCC 


AGGTACTTTA 


12060 




TTTACAGCAT TGTTAATACC AACACCTGTT 


CCACAAATAC 


AAACACCTAA 


GTCTGCATTA 


12120 


40 


CCGCTAACAA 


CTTGTTCGCC 


AACTTTTTTA 


CCAAAAATTG 


GATAATGTGT 


TCTTGTGAAA 


12180 




TCGTATGTTC 


CTACGTCAAT 


GACTTCATGT 


CCTTTTGATT 


TTAAAAATTC 


AGATACACGC 


12240 




ATTTTTGTAT 


CTGTAACAAT 


ATGGTCGCAT 


CCTAATGCAA 


TCTTCATAGT 


AATTTTTCCT 


12300 


45 


CCTTAGCACA 


TTTTATTAAG 


CATATCTACG 


CGGATTTGGT 


GTCTACCACC 


ATCGTATTTA 


12360 




CCTTCAACAA 


AACCTTTAAC 


GACATTTTTC 


GCTAATGTGT 


CTCCAACAAT 


TTCAGATCCC 


12420 




ATAGTGATCA 


TTCTTGAATT 


GTTATGGCCT 


CTAGTCATAT 


ATCCAGAGCG 


TTCATCTGAT 


12480 


50 


ACTTCAGCAG 


CAATCATGCC 


TTTGATTTTT 


GTAGCAACCA 


TAAAGCTACC 


TGCACCAAAT 


12540 




GCATCGATAA 


CAATACCTAA 


GTTACCTTCT 


TGACTTTGAA 


CATCTTTTGC 


TACAGCCAAA 


12600 
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TCTAATAAGT ATGATTTGAT GACTTCTTTT AATCGTTTGC CAGCTTCATC TGAACCAATA 12720 

ATAATCGCCA TAATAAGACT CCTTTTTACT TTAATTTTGA AATACCTTTC TTAAAATGTG 12780 

5 ACATATTTAT TTGTAGGTTA TGAAAATCTT GAGAAAAGGC TTTCAATTTG ATTACGTTTA 1284 0 

AATTATAAAC ATAAACAAAC AATAAATCAA CATAATATGT TTATAATATG TTTGTTTATG 12900 

ACGTATTTTC AAACAATAAG TGAACATTCA TATTGTGGTG TTGTTTTAAT TAGGTATTCG 12960 

10 

TCTGAAATTG TAGTAAAACT TTGTCGAGGT TCCCGTTGaC ATAAATTTGC ATAAAAAAtA 13020 

GCCCATAAAT GAATGCAAAT TCACATTCAC TTATGAGCAT ATAGATACAT ATTTTAACAA 13080 

TGCAGTTATA CTTTTAATTT AGTCGACTAC TTCAATATAT GTTTTAATCG TTTCTACTTT 13140 

75 

TTCTTCATCT TCATAGTCCA TGACCACTGC AGTCAATTCG TTTAACTGAC AAAATGATGT 13200 

AAAATCTTCT TTGCCAACTT TCGTATGATC GATTAACAAG TATTTTTCAA TTGAATTACT 13260 

20 TAGTGCCAGT TGTTGCGTAT AGGCTTCATC TAATGTAGAT GTCATCACAG CACCTTTATT 13320 

TACTGCGTTA CTACTAAAGA ACATCTTGCT AAATCTTAGT TTTTCCAACA TGGCGTTCGC 133 80 

cATTTCACCT ACAAATGCTT CTGTAATATG GCGCATTTCA CCACCAATTA AATAGACACG 1344 0 

25 AAAATGTGCT GTTTGTTTTT CTAACAAAAT TTTATACACC GGCAAACAAT TCGTAATAAT 13500 

TGTGAGCGTA TGATGATTGA CTTCTTCTGC TAATAGTTCC ACTGTTGTTC CTGGTCCGAA 13560 

AAACAAAGTA TCCCCATCTT CAATTAATGA TGCAGCTTTT TTAGCTATAA ATCGTTTTTC 13620 

on - 

TGCAATTTGA CGGGTATGTT TTTCTTTATG CGATATTTCT TTATACTGAA ATGTTGAATT 13680 

ACTGCGTGCA CCACCATGAA TCTTCGTTAA AATCCCTTTA TTTTCCAATT CAATTAAATC 13740 

TCTTCGAACT GTCATATCAG ACACATTTAA ACCTTCGACG ATTTCATTCG TTCTTATCGT 13800 

35 

GCCCTTTTTA TTCACTAGTT TAGCAATTTC GTCCAAACGT TCATGTTTAT TCAATGTAAA 13 860 

ATTGC2rrC 13868 
(2) INFORMATION FOR SEQ ID NO: 174: 

40 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4 54 9 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
4S (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 174: 
50 TTAAGTCAAC TTTGTCTATA CGGTTTGGAT CtTCTaCCCA ATGTCTTATA AAAGACAATC 60 
CCGCACCTGA AACATAACTC ATGAAATAAG AAAATGGTAT ACCATTAATT TGATCATTTT 120 
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AATCTTTACC CATACGAAAC ATCAATTGAT AAAATGCGAT GTCTTTTTCT ATCATTTCTA 240 

TTAAAACGGT CATAATTTGA TGTATGTTAT CCGTGGATAA CTTAACTGCT CCATTTAACT 300 

TCTCATCATG AATGAAGTCT CTTATTTCCT CCAACTGCTG GTCCTCTAAT TTTTCAAGCA 360 

AATCATACTT ATCATAATAA TGCGTATAAA ATGTACTACG GTTAACATCA GCTAAATCTG 420 

CAATTTGTrG CACAGTAATC TCTTCTAATT GGTGTTGATG TAAAAGTTCA ATAAATGCAT 480 

TTCTCATTGC AACTTGTGAT TTTCTAATAC GTCGATCTAT AGTCATTTAT ATCAAGTCCT 540 

CCCCAATGAT TATAAACGTT ATGTTCATTA TCCCACAAAT CTCCAACATT GATGATTGGC 600 

ACACAATGTT TACCTGTTTA ATATAGGTGA TACAAACAAA CAGAAAAAGG TGATAACAAT 660 

GAACCAACAT TTACTAGGAA ATCCAAAATT AACTGTAACT CATGTCAATG AAGTTAAAGC 720 

CGGTATTAAC CACATCGTTG TCGACAGTGT TCAATATGGA AATCAAGAAA TGATTATGGA .780 

20 AAAAGATGTC ACTGTGGAAA TGCGCGATGG CGAAAAATTA TATATTAATA TTTTCAGACC B40 

AAATAAAGAT GG CAAATTCC CTGTAGTTAT GTCTGCAGAT ACTTACGGTA AAGATAATAA 900 

GCCTAAAATC ACAAATATGG GTGCCCTTTG GCCAACATTA GGTACCATTC CGACATCTAG 960 

25 TTTTACACCT GAAGAATCAC CAGACCCAGG ATTTTGGGTG CCAAATGATT ATGTTGTAGT 1020 

TAAAGTTGCA TTACGCGGTA GTGACAAATC CAAAGGCGTC TTATCTCCAT GGTCAAAAAG 1080 

AGAAGCGGAA GATTATTACG ArTGATTGAA TGGGCAGCAA ATCAGTCATG GAGTAATGGA 114 0 

AATATCGGGA CAAATGGTGT TTCTTATCTT GCGGTGACTC AATGGTGGGT CGCATCATTA 1200 

AATCCACCAC ATTTAAAAgC AAtGATTCCT TGGGAAGGCT TAAATGATAT GTATAgAGAA 1260 

GTAGCCTTTC ACGGAGGTAT mCCAGATACT GGCTTTTATC GTTTCTGGAC TCAAGGTATT 1320 

TTTGCGAGAT GGACAGATAA TCCAAATATC GAAGATTTGA TTCAAGCACA ACAAGAACAT 1380 

CCTCTGTTCG ATGATTTTTG GAAACAGCGT CAAGTGCCAT TATCACAAAT TAAAACACCT 1440 

CTACTAACAT GTGCTAGTTG GTCTACACAA GG TTTGCACA ACCGTGGCTC TTTTGAAGGA 1500 

TTTAAACAAG CTGCATCTGA AGAAAAATGG CTATATGTGC ATGGACGTAA AGAGTGGGAA 1560 

AGTTACTACG CTAGAGAAAA TCTCGAACGC CAAAAATCAT TCTTTGATTT TTACCTTAAA 1620 

45 GAAGAAAATA ACGATTGGAA AGATACGCCT CATGTCATTT ATGAAGTTAG AGATCAATTT 1680 

TATAAAGGCG AATTCAAATC AGCGTCACGT GTCCCTTTAC CTAACGCAGA ATATACACCA 174 0 

TTGTATTTGA ATGCTGAAAA TCACACATTG AATCATGCAA AGATTAGTAG CGCGCATGTC 1800 

GCACAATATG ACTCTGAAGA TAAACAACAA GATGTAAGTT TTAAATATAC GTTTGACAAA 1860 

GATACTGAGT TAGTTGGAAA CATGAACTTA AAACTATGGG TAAGCACTAA AGACTCAGAT 1920 
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CCTGATTTTA ATCATATTGA AAATGGTCAA GTAGCTACTG GTTGGTTACG CGTATCACAT 2040 

CGTGAATTAG ATCAAGAAAA ATCCTCAATC GCGCAACCTT GGCATAAACA TGAAACAGAA 2100 

5 TTAAAGTTGT CACAAGATGA GATTGTACCT GTTGAAATCG AATTGTTACC TTCAGGCACG 2160 

CTATTTAAAC AAGGCGAAAC ATTGGAAGTT GTTGTAAAGG GTAGTGAAAT TGTAATTGGT 2220 

AATAGTACTC CTGGCATGAA AACACGTTAT GAACATGAAG AAACCGTAAA TAAAGGCATG 2280 

10 CACATGATTT ATACTGGTGG TAAATATGAT TCACAATTAA TCATTCCTAT CGTTAATTGA 2340 

TATGCAGCAA TTACGGTCGC TTTTGATTAA AAGTGACATA GTGATAGGAC TGTATAACAA 2400 

GAGAAAGCCA CACGCTTGGA ATCTTAAACC AAGGTGTGGC CCTTTTTATT ATTGATGGCT 2460 

15 

ATTTAATTTT ATAACACTAT CGTATTTTCT TTTTCATGAA TCATTTCAAT AATGACATTA 2520 

TCTTCATTCA TTACTGCTAC TTTAGGTGCA TGGTTTTTAA TTTCTTCTTC ATTCAACTGT 2580 

GCATAAGTCA TGATTATGAC TACATCGCCT ACTTCAACAA GTCTTGACGC TGCACCGTTT 264 0 

20 

AAACAAATTT TACCACTACC TCTTTCACCA GCTATTACGT ATGTTTCAAA ACGTGCACCA 2700 

TTATTATTAT TCACGATGGC TACIT TTTCA TTTGGCAAGA TGTCTACCGC TTCCAATATA 2760 

2S TCTGAATCAA TCGTAATGCT ACCTACATAA TTTAAATTTG ACTCAGTCAC TCTTGCTCTA 2 820 

TGAATTTTAG CATTCATCAT TGTTCTTATC ACTTTATTCA GCTCCAATTA TTATATTATC 2880 

TATTAAACGC GCTTTTGAAA ATTTAACAGC TAAcGAGATA AATATGCGTC CAGTTATTTC 294 0 

30 GTGTTGTTCT ACTAATTGAG GATAACTATA AACAGCAACT TCTTCAATGC GTTCACTTAT 3000 

ATGTGATTCA AGATATTCAG TAACCCTGTC TATAATTACT TTACTTTGAC GTTCACCGTC 3060 

TTGATACAAC GCTTGTGCTA ATAGCAAAC7 TTTACTTAAA TGTACCGCTT CTTGTCGTTC 3120 

35 TTGCTCCGTT AAATAAACAT TTCTTGAACT TTTCGCCAAA CCATCTGCTT CTCGAACGAT 31B0 

ATCA£TACCA ATAATTTCAA CGGCATGATT GAAGTCTTTT ACCmTTTGCT CGaCAATAGC 324 0 

CAATTGCTGG GCATCTTTTT TACCAAAATA AGCATAATCC GGCATAACAA TATTAAATAG 3300 

40 

CTTATTAACT ACTGTTACCA CCCCATCAAA ATGCCCTGGr CCGtTCGCTC CTTCTAACAC 3360 

ATCAGCTAAT GGGCCTACTT TGACATCAAT ACCTAATTCA CCTGGATACA TATCTTCTAC 3420 

TGCAGGATGA AAAACAATGT CCGCTCCTAC TTCTGATACT AATTCTAAAT CTTTATCAAT 3480 

45 

TTGTCTCGGA TAAGCATCGA AATCTTCGTT TGGACCAAAT TGTAATGGAT TAACAAATAC 354 0 

ACTCACAATT GTAATATCAT TTGTACTAAC TGATTCGCGT ACCATCGTTA AATGTCCATC 3600 

50 ATGTAAGGCA CCCATTGTTG GGATAAAACC AATCGTTGTG CCTGAGCGTT TGGCTGCTTT 3660 

AACAATGTGT TGCATCTCTT TTACCGTAGT AATCAGCTTA GTCATTGTTA TTAACCTCAT 3720 
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GATCGTATTG TTTTAAACCA TCCACACCAA CACTAAAATC AGCAAATTGC TTCACAAATT 3840 

TCGCTTTATG TTCAACACCA TAATTTAACA TATCGTGATA AACCAATACT TGACCATCTG 3900 

TACCTTTTCC TGCACCAATA CCAATGACTG GAATTGTTAA GTGCTTGCTA ATTTCTTCTG 3960 

CTAAATCATT TGGAATTGCT TCAAGTACTA ACGCAACTGC ACCAGCTTGT TCTACATTTT 4020 

TCGCGTCTAA AATAAGTTGc TCCGCTGCTT CTTTCGTTGC ACCTTGTAAT TTATACCCCA 4080 

TAACGCCAAC ACTTTGAGGT GTTAATCCTA AATGTGCAAC AACAGGAATA CCAATTGCCG 4140 

TTGCTTTTTC AATAAATGGT GTAATATGCG CTCCTTCTGC TTTAATTGCA TTTGCATTCG 4200 

TCTCCTGATA AAGCTTTAGA GCATGATTTA AGTCTTGTGT CATAGAGATG CCTACTGCAC 4260 
CAATCGGCAT ATCAACAACT ACAAATGTAT TTGGTGCGCC TCTTCTTACT GCACGACCGT . 4320 

GATGAATCAT ATCTGCTAAC GTCACTTGTA CGGTACTTTC ATAACCTAAT ACAGTCATAC 4380 

20 CAAGTGAATC CCCAACAAGA ATCATATCAA TACCCGCTGC TTCCACTTGT TTAGCACTTG 4440 

GAAAATCATA AGCTGTTACC ATAGAAATTT TAGTTTGCTT TTGTTTCATA TCTATTAATT 4500 

GACTTACTGT TTTCAATGTT ATTCAACCTC TTTTTGCAGT ATnATTAGA 4549 
25 (2) INFORMATION FOR SEQ ID NO: 175: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 8339 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 175: 

TTATCTTTTG TTGTTTCCTT AGACAAACGA CTAACCACAT TATAATGGAC TAATTTATTA 60 

ATTTTATTTA ATTCCATTAA GTTATCCGTA ACACTAAGTG AAGATGCGGA GTTCACTCTC 120 

GTTTGTACTC TTCGTTTTAA TAAAGCACCT CGTAATAATA CAATCATTCT TCTTATTAAT 180 

GATGCTTGTC TATATACCTG TGTTCTTTCA GCATAACGCA TATAGTTTTC AAGTACACTA 240 

TTCGTTATTT GTCCTTCATC TACTAAAGAC TCTAATGTTT TkGTTTCTAC ATTAAAAGCA 300 

45 ATTTTTTGTA GACGTTCTAA TTCTTTAGAG TTTTCATCAT CTTTCTCTAC AGTTTTTAAA 360 

AATGCTAATT TATCATGATA TTCTTTAATC ACGTTACCAT ATTTAAAACT TGTTTCGAAA 420 

GTAGATTTTT GATTTAGATA ATCAATAACT TGTTCTAATA TATAAATTCT AGCAACTTTA 480 

AACGACATAT TGCCAATTAC TGTTTTAGGT GCAGGTTTCG TTAATAATGG CAATAATACT 540 

TGCGCAACTA CCAAACTAAT AATAACCATA CCAGATGCAA TAAATAATAA GTCGTTTCTA 600 
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ATTGTTCCAT 


GCACACCACA 


TAACGTCATA 


ATTAAAGCGT 


ATAAACTTCG 


CTTTGGTGGT 


720 




TTCTCAGTCG 


TTGGATTATC 


ATCATCATTT 


TTAGTCATCA 


TTTTTTGGAA 


TGGACTGATG 


780 


5 


GCTAAATAAA 


AATAAGGATA 


TAAGACATAA 


ACCCAAACAA 


ATCTAAATAG 


ATAGACAGCT 


84 0 




AAAGCAACAA CAATAGTGAT GCCTATTAAA AAGATTAAAT 


TGTGCGGTTC 


TGTTTTGATA 


900 


10 


ATTTTAATAA 


TAACTTCAGG 


TACTAAAAAT 


CCTAATATTG 


AAAAAACAAA 


GCCATTTAAA 


960 


ACATAAC CTA 


GTATATTCCA 


TGTATGATTG 


TAACTCATTT 


GCAGTTGTGT 


ACGTACTTGC 


1020 




ATAATTCTGT 


CACGTTCGAA 


ACCATGTACA 


AGTCCTGCAA 


CTACTGCTGC 


AATGATTCCT 


1000 


15 


GATGCGTGaA 


ACAATTCAGC 


AATTAAATAC 


GTAACAAATG 


GTGTTAACAA 


TTGAATAATT 


1140 




GTAAACATAT 


TAATGTTTTC 


ATATCCTCGA 


CGCATCAATG 


TTAATCGGAA 


CCTTACTAAT 


1200 




GCCATACCTA 


TAAGTAAACC 


AACCACTGCG 


CCACCAATTG 


ATGCAATTAA 


AAACAACTGA 


1260 


20 


ACAGCATCAA 


CAAGTGAAAA 


AGCACCTGTA 


ACTAATACTC 


CAACAGCTAT 


TTTAAATGAA 


1320 




ATAATACCAG 


CAGCATCATT 


CAATAATGAC 


TCACCTTCAA 


GAATTGTCAT 


TGCTCCTTTT 


. 1380 




GGCAAGACCT 


TTCCTTTAGT 


GATTGCTTGC ACTGCTACTG 


CATCAGTAGG 


ACAAAGAATG 


1440 


25 


GCAGCAATTG 


CAAATGCTGC 


TCCAATAGGT AAATCTGGCC 


AAATCCAATG 


AATAAATAAA 


1500 




CCTACACCTA 


TCACAGTAGT 


AATGACTAAT 


CCTAATGCCA 


TCATCATCAC 


TGGCTTAATA 


1560 




TATTTCCTTA 


AATGGACTCT 


AGAAACATTA 


ACACCTTCTA 


CAAATAACAA 


AGGCGCAATC 


1620 


30 


ATTGTTACCA 


TAAACAATTC 


AGAATCAAAA 


TTAAATTGAA 


CAGGGATTGG 


GGTAATAAAT 


1660 




AGTAACATGC 


CCAAGAAAAT 


TTGTATAAAT 


GCTAGGGGTA 


CTTTAGGTAT 


GAAAGTATGG 


1740 


35 


ACAAACGAAC 


TTAGTATCAC 


AACAGCTATA 


AATATAAGAA 


TTGTTTCAAA 


TATTTCCAAA 


1800 


CTTTCACCTC 


TCTAAAAAGT ATTGTTTAAT 


TGAAAATTAA 


GTATCACATC 


TCGTTGTAAT 


1860 




TATAdTTAG AGGATAAATT GAGTTAGCGA CCACAAAAGC 


ACTTTAATAT 


AGATATATGT 


1920 


40 


CTACGATTGC AGTACTTAAA TTTGCAATTA TTTAATTTTA 


TTTTATCACT 


AATTGTTTGT 


1980 




ATAAATAAAC 


AACTTGCTTT 


CACATAACAA 


CATTAACTTA 


TAATACAAAA 


AATGAGCACC 


2040 




TTAAAATCGA 


CTAACCAATT 


TCaAAGTACT 


CTTTTAATGA 


TTAATTTTGA 


AAACAGATTT 


2100 


45 


TCaAAAGCAT 


TGTTATGCTT 


AACAATTTAG 


CCAACACTTC 


AATCGTTTTG 


ATACCATTTC 


2160 




TTACGATGCT 


CTTCTCGTTT 


TTCAGCACGT 


AATTGTAATG 


CTTCTGTAGA 


GTTTTGTTCA 


. 2220 




TTTGAACTTA 


ATAATATTGA 


TGCATGTGTG 


TGAGCATCAT 


TTTTTCGATA 


CATATAAGCG 


2280 


50 


CCGTTGCGAT AAGCAGCGCG AGCGACTAAG 


TGCATGCCGA 


CTGGTGAAGT 


TAAATTAATA 


2340 




AAAACAAGTG 


ACAGTAATAA ACGCACACTG 


AAAAATCCTG 


TATTCACAAT 


AAAATAAATT 


2400 
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CTTAAGAAAA CATCTTGGAA TTTCACGATA CCTATTGCAC TAATAAGAGC AATAAAACTA 2520 

CCTAACAACA ACATCACAGC AGCAATAAGA CTAAAGATTT CTTTTGTTAT TTCCATTAAA 2580 

CACATGCCCC CCACCAATAA AGCGTGATAT TGAAACAGAA CTTACAAAAG ATATAATGGC 2640 

AATGAGCATG ATTGAATCTA AGAAAGAAAC GGTGCCCATA AGTACACTTA ACACACCCAC 2700 

AATTGACATT ACGACAGCAC TTGTTGTATC AAATGTAACG ACACGATCTG CTGTTGTAGG 2760 

TCCCTTGATT AATCTAAATA AACAGATGAT TAATGCAATT CCAAAAATAA TGAGTGAACT 2820 

AATAATCATA ATATGTGTTA TTGTTTGTAT CATCGCGACA CCTCCAATAT TAAGTCTTCA 2880 

TAATGCTTAA TACTTCTTAA CAAACTATCT TTTTCTTTTT CTGACACGTC GATACTATGA 2 940 

ATAAAAAACT TTTTAGAGTC TTGAGAAATT CGTATTACTG TAGACCCTGG AGTTATAATA 3 000 

ATTAAAATTG TTAAAAATGT TATTGACCAA TCACTTGTTA GTCTTGTTTC ATATGAAAGT 3 060 

20 AATCCAGGGT TCATATCTTT TGTTTTAAAA AGAATATAAT TAATCGTGCT AATGCTAGAT 3120 

GTTATTAATT GATATAAATA AACACCTAAA AATTTAATAG CTACCCATAT TTTTCTAACA 3180 

TAAAAATCAT CGCTGAAAAA CCTGTGTAAT ATATAAATGA CAATTAAACC AATTAGATAT 3240 

25 CCAGAAAAGA AAGTCGAGAA TTTAAAATGA TCTTCATCTT GAAATAATAC CCATAAGAAT 33 00 

GCAATGATAA TATTTAAAAC TATTTGATTC ATTTAGTCCT CTCCTTTCAA ATGCGGATTT 3360 

ACAAGTTTTT GATATAATTG ATCACTCGTG TTCAACTCAG TTGCATCACT TGTAACATTT 34 20 

AACACAACAG GTGCAGCAAT TCCGATTGCG ATAACCACAA CTACTAAAAT ACTTAAAATT 34 80 

CTTTTTCGAT ATAGCGGGAT TTTCTTAAAA TTAACTTCCT CCCCATCTTT ATCTCCAAAA 3540 

TACATATAAA AAAGTATCCT AAATAAACTG TACATTGCAA TTAGACTAGT AATAATCATT 3600 

AACGCTAGTC CAATATAATT GCCATTTTGC AATGCACCTT GGAAAATAAG TACTTTCCCC 3660 

GGAAAGCCAC TAAATGGAGG CACGCCGCCA ATAGCAAAAA TCATTATAAT AAACGCAACT 3720 

CCAAATAAAG GTTCTTTTTT AGCTAAGCCA TTCAAATATT GATATTGTCG ATAG CCTGTA 3780 

ATGTAAACTA AACTACCAAT AATAAAAAAT AGCAATGTTT TTACAACAAT GTCATTTACC 3840 

AAATAAAATA TTGCACCATT AATACCTGCA AACGTGTTTG TTCCTAAACC TAAAATGATA 3900 

45 AATCCTATTG AGATTATGAC TTGGTAAGCT GCAATCTTTT TAATATCTTT ATAAGCAATG 3960 

ACACCTATAG CGCCGATGAC CATAGTTATA GCAGCCATAG TTGCTAGCAA TGGATGTATG 4 020 

AGATCATTAT GTTGATCAAA TAGTAAAGTG AAGAATCGAA TTAATGCATA GGCCCCTACT 4 080 

50 TTGGTCATTA ACGCTGCAAA TAATGCTGCA AGCTcAGTAT TTAACACAGC GTAGGCTTTG 4140 

GGTAGCCACA TAAAAAGGAC CAGCGCTGCT TTCGCACTAA ATGCGACTAA GAAGATTAAT 4200 
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AAGTTTAATG TACCTACTGT TTTATAAAGT 
CCAATAATAT TCAAGACAAC ATAAATAATT 
AGTGTAATGA GTACAAATGA CGCTAGTAAC 
AAATCTGATG TTAGAAAAGA GCCTATCACG 
AAGTGATAAC GATTTGCTTT ATGTTCGCCA 
ATCACAAACG AAGCGGTTGT AACCATAATT 
CCAAAGGGCG CTGACCATCC TCCAAAGTCT 
ATTAATAGCA TTAATGAAAT AATTGTGGTG 
GAAATACGAT CATTATTTTT TAAAAATACA 
ATTGGTAAAA TCAATAAGTT ACTTAGCATC 
TTCTTTTGTT ACTTTATAAG TTCTATAAAC 
CCCTATAACT ATTGCAGTTA GTACAATAGC 
TCCACCAGTT ATTAGTGGTT CTGATCTACT 
GAGATTACCA GCATGAGTAT ATATTGAAAT 
TAAAATCATA TATGTTCCTA TAAACACTAA 
CATGATCGAC CTCCGCTAAG CGACAACATC 
AAAATACCTA ATTCAAAAAG TGTTATTGTA 
ATCCAAGTTG TTTCATATTG AGACAAAAAT 
GTAATAGATG ATACCAATGC TCCAATAATC 
TCTAAAACCT CTTCAACATT AAAAGC CAGA 
AAACCACCAA TAAACCCACC ACCAGGATTA 
AAAGTCAATA AAATAAATAC AACAAGTTTC 
TTCATCTTGT CCCCTCCGAT CTTGATAATT 
AATTAACACT AATCCTTCAA ATAATGTATC 
TACAATATTT TTACCACCTG TTAGTTTGTC 
TAAACCATCT GTTTGTTGTG TAATAAAAAT 
TGATACAGAA ATTTTAATTA TTTCTCTTTT 
TAATCTTGAA AAACTGACAA TAAATAGTAT 
CAATGCTAGA TCAGGGGCTT TCATTGCTAT 



AAACCTATAC CTAATAAGAA TAGCCATGAA 
GCAGCACGTA ATTGTTCTAC AGATTGTCCA 
ATAATTTCAA ACATGACGTA TAAATTAAAT 
CCAACACTTA AAAATAATAT GAACGATGGC 
CGCCCAAATC CGTATGCCAT AATTAAAGTA 
AAACTTAAAG AATCTCCTAA AAACTGTATA 
AGCGTAATTG GACGGTGACG CTGAACATAA 
ATAGTCATTG TACCTAAGTA TAAATATTTA 
AGGATTAAGG CACAAAGGAA TGGTAATAAC 
ATCTTCCCCC CTTAGGCCTT CAATTTCATC 
AAGTACAAGT AAAAACGCAG TCATCCCAAA 
TTGTAACAAG GGATCAACAA ACAATTGGTT 
AGAACCATAC GTTCCCATAC TCATAATAAT 
TCCGATTACA ATACGAATTA AATTGATTGA 
AAATCCTATA ACTAGTAATA ATATTAAATT 
ACTGTGACAA TAACACCAAC AACTGAGAAT 
CTTACATGAA TTTGTCCTAA AATTGGAAGT 
GGTTTTCCAA AAAACATAGG TATTATCGCA 
ATTAAAATTC TAAAATCAAT CGGTAAACTT 
AACATTAAAA TAAACGCTGA ACTAAATATT 
TTATGACCTG CGAAGAAGAC ATAGAATCCG 
GTGACCGTTC TTAACACGAC ATCATTCTCT 
TAATAATGtg TAAATACCTA GCCCAGTAAT 
TAATGCTCTA AAGTCACCAA GTATCGCATT 
AGCTTTTAAA TAAAAGTCTG ATATTGATGA 
TAATGATACA ACAATAAGTG CCATCAAGAG 
TTTGTTAGCG TTAGATCTTG GCACGTTTGG 
CGTCGTTATT GTTTCAACTA CTAGCTGAGT 
AAAGAATAAG GTCACAACAA ATCCGATGAC 
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GACAGTTACG ATTGCTAATA TAATTTCTAA TGCCCCAAAT TCAGAAACAT GTAACTGATG 6120 

TACTTTAGGA AGTCCaATTC GAATATAACC ATATCCAATG ATAATCATAA ATATGCCTAA 6180 

GGTCATAATA ATGTACTGGT TTAAACGATC TTGCATAACA CGTTTAAATC GCTTCGTAGC 6240 

AAACTTTTCA AAATGTCGAT ATACCATCTC ATAGCTTTTT GAAACTGAAA TCTGTCTAAT 6300 

TTTACCTGTG AACACTTTTT TCCAATCTAC TTTGATTGCT AGTACACTAC CCAATAAAAT 6360 

AATGATGATG GTTAAAAGAA GCGGTATGTT AAATCCATGC CATTGCGAAA CATGTGGTGC 6420 

CAATTGATCA ATTTGATGAT TACCACCTGA TACAGCTCTT AATGCnAGAA CGATAATCCC 6480 

CTTCCCAAAT ATATnTGGTA CAAAAAAGAT TACAGGTACT AGCACCATTA aTATAAGAGA 6540 

TGGTAAACTA aACAACCATG GTTCGTGGAT ATTTTTTTTA GTAAAAACCT TAGAATCATA 6600 

TTTTGtCCAA AATACTTCTT TTACCATGTA TAGTGCATAT GTGAATGTAA AAACACTCGC 6660 

AATAACACCA ACAAACACGA TAGCTATCAT TGAAATCAAA CTAAATTGGG ATAATTGTCC 6720 

AGTTTGTGTT AATGCATCTA AAAACATTTC TTTACTTAAA AATCCATTTA AAAATGGTAC 6780 

TCCAGCCATA GATAGAGCCG CTATCGTCAT GACTAGATTC ATTTTAGGAA ATAGTTGACG 684 0 

25 CATTCCACTT AAAATTCGTA TATCCCTTGA ACCTGCTTCA TGATCTAAAA TACCTACTCC 6900 

CATGAAAAGC GCACATTTAA AGATGGCATG ATTCATTAGa TGAAATAGcG CACCArATAA 6 960 

TACmAATACA TAAATaGATG CTATTGCGTC TTGTTGGTGT TGAGCATATC CGCCACCTAT 7020 

50 ACCCACCATA GCCATAATCA TCCCAAGTTG ACTGATTGTA GAGTACGCTA GGATACCTTT 7080 

TAAATCCCAT TGTTTTAAAG CTGTAATTGA ACCAAATAAC ATTGTTATTA AACCAACAAA 714 0 

CGTAACGATA TATACGTACA TATTGCTAnG ACCTAATAAT GGTGTAAATC GAAGTAATAG 7200 

AAnGATACCA GCTTTTACCA TCGTGGCTGA ATGTAAATAA GCACTTACAG GTGTAGGTGC 7260 

AGCCATTGCT CTAGGTAGCC AGTATGAAAT GGAraTTGTG CTGATTTTGT AAATGCACCT 7320 

AATAAAAACA TAAAAATCAT AGGGATAAAC AATCCATGAT TCTTAATATG ATCTGCTTGT 7380 

CCTAATATCT CTGTGATGTT ATTCGTTCCT GTCATGATAT ACAGCATAAT AAAACCAACT 7440 

AATAACGCCA ATCCACCAAA TACTGTAATC ATAAATGATT GAATCGCACC AAATTGACTG 7500 

TCACCATTGT TATACCAATA TGAnATCAAT AAAAATGATG ATmCACTCGT TAATTCCCAA 7560 

AAaATGTACA TCmATATCGT ATTGTCTGAT AATACaaTAC CAATCATACT GAACATAAAT 7620 

AACGTTAAAT AAAAATAAAA CCTTGGTAAA TTGTCTTTTC GAGAGGATAA ATATTGAGTT 7680 

50 GCATAGAAGA ATACTGCAAT TCCAATAAGT GAAATAATAA GAGAAAACAT TAAACTTAAA 7740 

_ CCATCTAAAC GTAAATCTAA ATTAATATCT AATGTCTTAA TCCATGGAAT AGAGGTAGAA 7800 
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GGTGCAACCA ACGCTATGTA CCCGGCATAT TTAGCCAATG CTCTACGTTT AGACATTAGA 7920 

AGTATCATCG CCATAATCAC AAGTATAGCA ATTAATAAAT AAACCAAACT CATTATTAGC 7980 

5 

CTCCTTTGTT TCTATAATTG TAATGAAATA TAAATACTAT GTTCACACTC ATTTTCTAAA 8040 

CCGATAAAAT TTAGTGTTTC AATAGCAGAT TGATGCCCTA AATACTTTTG AATGACTGGT 8100 

ATAAGTATAC CTTTTTGATA AGCATGATAT GCAAATGTCT TACGCAATGT CGTTAGTCCT 8160 

10 

ACATTATCTA TACCAGCTTC AATTGATGCT TGGTGAATTA TTCGATATGC TTGCTGTCTA 8220 

GATAATACTT GATTTGTTCG TAGTGATTGA AAAAGAACGT CTTCATTCGA AAGACTCCTG 8280 

15 TCCTCTATAT ATTGAAGTAG TTCTTTCGAT AATGTTTCTG GTAACCTAAT TTTAATCAA 8339 

(2) INFORMATION FOR SEQ ID NO: 176: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 588 base pairs 
20 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



- (Xi) SEQUENCE DESCRIPTION : SEQ ID NO: 176: 

CCCGATTTTT TTACGTAATC TAATACATAC GGCAAAATCA ACTTTAATCA AAAAAGACTC 60 

ATACACAATG CCTTTAAAGC ACATGTATGA GTCCTTTTTA GTAGTTTATA TCAAAAAATA 120 

30 

GTTTAATGTA TAAATTAGTT TTTGTTTACA GATGCGTCGT AGATTGATTC TACAGCATCA 180 

CCTAAAGCTT TATCGAATTC TTCTTTAGAT TGATCAGCTC TTAAATCACT AGCTAATGCA 240 

CGTGAGAAAC TTGCGATAAG TTCAGCGTTA TCTTTAAGTA ATTCATTTGC TTTTTCTCTG 300 

35 

CTGTAACCAC CTGATAATAC AACGACACGA ACAACATTAG GATGTTCAGC TAACTCTTTG 360 

TATAAGTTTG GTTCAGTAGG AATTGTTAAT TTCAACATTA CTAATTGATC AGCATTTAAG 420 

40 CTATCTAAAC CTTTTTTAAG TTCAGCTTTT AATACTTTTT CAATTTCAGC TTTGTCTTTT 480 

GCATTAATAT TAACTTCTGG TTCGATAATT GG AACTAAAC CTTTAGCAAT AATTTGTTTA 540 

. GCAACTTCAA ATTGTTGTTC AACAACGTCT TTGATACCTT GCTCATTT 588 

45 (2) INFORMATION FOR SEQ ID NO: 177: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2841 base pairs 

(B) TYPE: nucleic acid 

5 (C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 
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ATAGAGTnCT 


GGnACTTACT 


ATGACATATG 


GCGCTAGAAT GGCTGAGCCA 


GGTGAATTTA 


60 


CAAAACGTGC 


CTTTTTAAAT 


GGTCGTATTG 


ATTTATCTCA AGCTGAAGCA 


GTTATGGACT 


120 


TTATTCGCTC 


GAAGACAGAT 


AGAGCTTCTA 


AAGTTGCGAT GAATCAAATT 


GAAGGTCGTC 


180 


TAAGTGACTT 


AATCAAAAAA 


CAACGTCAAT 


CTATATTAGA GATACTCGCT 


CAAGTGGAAG 


240 


TGAATATTGA 


TTATCCTGAA 


TACGATGATG 


TTGAAGATGC GACTACTGAA 


TTTCTTTTAG 


300 


AGCAGTCTAA 


AGAAATCAAA 


CAGGAAATTA 


ATCGTTTATT AGATACCGGT 


GCGCAGGGTA 


360 


AAATTATGCG 


TGAAGGTTTA 


TCTACAGTTA 


TTGTTGGTAA ACCAAACGTA 


GGTAAATCAT 


420 


CGATGTTAAA 


TAATTTAATA 


CAAGATAATA AAGCGATTGT AACTGAGGTA 


GCAGGTACTA 


480 


CTAGAGATGT 


CTTAGAAGAG 


TACGTCAATG 


TTCGTGGCGT GCCATTAAGA 


TTAGTTGATA 


540 


CTGCTGGTAT 


ACGTGAGACA 


GAAGATATAG 


TAGAGAAGAT TGGTGTTGAA 


CGCTCTAGAA 


600 


AGGCTCTTAG 


CCAAGCAGAC 


TTAATTTTAT 


TTGTATTAAA CAATAACGAA 


GCATTGACwC 


660 


AAGAAGATTA 


CACATTATAT 


GAAGTGGTTA 


AAAATGAAGA TGTAATCGTA 


ATTGTTAATA 


720 


AAATGGATTT 


AGAGCAAAAC 


ATAGATATTA 


ATGAAGTTAA AGATATGATA 


GGTGATACGC 


780 


CATTAATTCA 


AACTTCAATG 


TTAAAACAAG 


AAGGTATTGA TGaATTAGAA 


ATACAAATTC 


840 


gAGATTTGTT CTTTGGTGGa GAAGTACAAA ATCAAGATAT GACTTATGTT 


TCTAATTCAA 


900 


GACATATTTC 


ATTATTAAAA 


CAAGCAAGAC 


AAACGATACA AGATGCGATT 


GATGCAGCAG 


960 


AATCTGGTGT 


GCCTATGGaT 


ATGGTACAAA 


TTGATTTAAC TAGAACTTGG 


GAAATATTAG 


1020 


GAGAAATTAT TGGTGAGACT GCAAgTGATG AACTCATCGA TCAGTTATTC 


AGTCAATTCT 


1080 


GCTTAGGTAA 


ATAGTAATTG 


AAATAGACGG 


AATACCGTCT TAAGAAGGCT 


AGTAAGATAT 


1140 


CAAATAAGGA 


GGTTTATATT 


GTGGTTCAAG 


AATATGATGT AATCGTTATA 


GGTGCGGGAC 


1200 


ATGCAGGTGT 


AGAAGCAGGT 


TTAGCATCTG 


CAAGACGTGG TGCTAAAACA 


TTAATGCTAA 


1260 


CAATAAATTT 


AGATAATATT 


GCATTTATGC 


CATGTAACCC ATCTGTAGGT 


GGACCAGCTA 


1320 


AAGGTATCGT 


TGTTCGTGAA 


ATTGATGCTT 


TAGGTGGACA AATGGCAAAA 


ACAATCGATA 


1380 


AAACACACAT 


TCAAATGAGA 


ATGTTAAATA 


CAGGTAAAGG ACCTGCTGTA 


AGAGCACTAA 


1440 


GAGCGCAAgc AGaTAAAGTA CTTTATCAAC AAGAAATGAA ACGCGTGATT 


GAAGATGAAG 


1500 


AAAATTTGCA 


TATAATGCAA 


GGTATGGTAG 


ACGAACTTAT TATAGAAGAT 


AATGAAGTTA 


1560 


AAGGTGTACG 


TACAAATATT 


GGTACAGAGT 


ATTTATCTAA AGCAGTAATT 


ATTACAACGG 


1620 


GAACATTTTT 


ACGTGGTGAA 


ATCATTTTAG 


GTAATATGAA GTATTCAAGT 


GGACCAAATC 


1680 


ACCAATTACC 


ATCAATCACA 


TTATCAGACA 


ATTTAAGAGA ACTTGGTTTT 


GATATTGTTC 


1740 
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20 



25 



30 



AAATACAACC 


AGGTGACGAT 


GTAGGTCGTG 

w X AW X W X V? 


CATTCAGCTT 


TGAAACAACA 


GAATATATAT 


1860 


TAGATCAATT 


GCCATGTTGG 


CTAACGTATA 


CTAATGCTGA 


AACACACAAA 


GTTATCGATG 


1920 


ATAATTTACA 


TCTATCTGCA 


ATGTATTCAG 


GGATGATTAA 


AGGAACCGGG 


CCACGTTATT 


1980 


GCCCTTCAAT 


TGAAGATAAA 

A \j£^£^\j^\ X ^^^^^^ 


1 v T v Pf2'T , Tr*ftAT 
xxx v* x x v>un x 


TTAATGATAA 


GCCGCGACAT 


CAACTTTTCT 


204 0 


TAGAGCCTGA 


AGGTCGTAAT 


ACAAATGAAG 


TATATGTGCA AGGATTGTCT ACAAGTCTTC 


2100 


CTGAACATGT 


GCAcGTCAAA 


TGTTAGAGAC 


GATACCAGGT 


CTTGAAAAAG 


CAGATATGAT 


2160 


GCGTGCCGGC 




ft ftTftTriATYIP 


GATTGTGCCA ACGCAGTTAT GGCCTACACT 


2220 


TGAAACGAAA 


txx\3J\± xJwvvn 


nUl Anx.Hx.HL. 


TGCAGGTCAA 


ATTAATGGTA 


CATCTGGTTA 


2280 


TGAAGAAGPA 




A TTY1 A TYl/ir 1 
Unl IVjniwv 


AGGTATTAAC 


GCTGCAGGTA 


AAGTGTTAAA 


2340 




A Af3 A T ATT ft A 




TGCATATATT 


GGTGTCTTAA 


TCGATGATCT 


2400 


TfiTAAPTAAft 


rtfiT A rT ft ft Tr* 


ft A PPTT ft Tpp 


TTTACTAACA 


TCACGTGCAG 


AATATCGTTT 


2460 


f^TTirTtrV^T 

VJ X Irtt Ih^tU 1 


PATnATftftTrt 




ATTGACGGAT 


ATGGGATATG 


AACTTGGTAT 


2520 


t*i ATTTr'Tfift a 


UnAnUnlnlu 


CACGTTTTAA 


TGAAAAACGT 


CAGCAAATTG 


ATGCGGAAAT 


2580 


TAAGCGTTTA 


TCAGATATTC 


GTATTAAACC 


AAACGAACAT 


ACGCAAGCGA 


TTATTGAACA 


2640 


ACATGGTGGT 


TCTCGCTTAA 


AAGATGGTAT 


TTTAGCTATC 


GATTTATTAC 


GCAGACCTGA 


2700 


AATGACTTAC 


GATATAATTT 


TAGAACTTTT 


AGAAGAAGAA 


CATCAATTGA 


ATG CAGATGT 


2760 


TGAAGAACAA 


GTAGAAATAC 


AAACAAAATA 


TGAAGGTTAT 


ATCAATAAAT 


CACTACAACA 


2820 


AGTTGAGAAA 


GTTAAGCGTA 


T 








2841 



(2) INFORMATION FOR SEQ ID NO: 178: 

35 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3025 base pairs 
r (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

40 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 178: 
ATCTAATTTC AAACCCGGTG ATAAATTGCC AAGCGTGACG CAATTAAAAG AACGTTATCA 60 

45 

AGTAAGTAAG AGTACTATCA TTAAAGCATT AGGCTTATTG GAACAAGATG GTTTGATCTA 120 
TCAAGCACAA GGCAGTGGTA TTTATGTGAG AAATATTGCT GATGCCAATC GTATCAACGT 180 
CTTTAAGACT AATGGTTTCT CTAAAAGTTT AGGTGAACAC CGAATGACAA GTAAGGTACT 240 

SO 

TGTTTTTAAG GAGATTGCAA CGCCACCTAA ATCTGTACAA GATGAGCTCC AATTAAATGC 300 
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CGAATATTCT TATTATCATA AAGAAATCGT GAAATATTTA AATGATGATA TTGCTAAGGG 42 0 

CTCTATCTTC GACTATTTAG AATCAAACAT GAAACTTCGT ATTGGTTTTT CAGATATTTT 480 

CTTTAATGTA GATCAACTCA CTTCAAGTGA AGCTTCATTA CTACAATTGT CTACAGGTGA 54 0 

ACCATGTTTA CGTTACCACC AGACTTTTTA TACAATGACT GGCAAACCCT TTG ATT CATC 600 

TGACATCGTA TTTCATTATC GTCATGCACA GTTTTATATT CCTAGTAAAA AGTAATAAAT 660 

ACATAAAAAC GTCTATATCC CAGTTATAAA CTGGAGTATA GACGTTTTTT TACGATAATA 72 0 

ACAATGGCTC AAATTGCTAT TATCTTGCTT AGGTTTTTCG TTTTAGAAGA ATATTGCTAC 780 

AAAGACAGGC ACAACTGCTA CAACAACTAC ACCAACTAAC ACTAAAGCTA TACTTGCCAT 840 

TGATTCTTCT ACAGGTCCTA ATTCTTTGGC TGGTGCTACA CCTAATGTGT GACCACTTGT 900 

TCCAAGTGCT AATCCTCGGG CAATAGGGTT AGTAATTCGG AAAAGCTTTA AGAATTTATT 960 

ACCTAGGGCA TAAATAATGA CACCATTTAA AATAACTGCT AATGATGTTA ATTCTTTTAT 1020 

ACCACCGATA CCAGCTGATA CTGGTAACGC AATCGCTGTA GTTGCTGCTT GAGGTAACAT 1080 

TGATAAAATA ACATCATTGG CAAATTGTGC TAACTTCGCA AAAGTTAAAA TAATTAATAA 1140 

CGCTACAACT GTACCGATAC CAATACCTCC GATGATACGA TGCCAATGTT TAACAAGCAC 1200 

TTCACGCTTT TTATATAACG GAATCGCAAA ACAGATTGTT GCCGGTTCTA AGAAGAAGTA 1260 

AATAATGTCT CCACCTATTT TGTAAGTCTT ATACGGAATG CCTGTTAAAT AGAGGAAGGC 1320 

30 CACACCAAAT ACCATACTGA CAAATAGCGG TGCGAATAAG AAGAAACGAT TAGTTTTTTC 1380 

AAATAATATG GTCGCTAAGA AAAATGGTAT AACGGATAAC AGTATTCCGA AGTAAGGTGT 144 0 

GTTTaGTGCT AAGTGGTTAA TCaTGAGCTT GTGCCTCCTC TATTTTGATC TTTTTTGTGA 1500 

35 CTTTGTCACC TTTAGATCTC GAAGTAACTT TCATAATAAT TTgTGTGACA TAGCCAGTAC 1560 

AAAT&AGTAA TAGTATTGTT GAGACGATTA TTAGTCCAAT GATTAAAAAT GGTGCTTGGC 1620 

TAATGACACC TAAAGAGTTA ACAACTGAGA TACCGGCTGG TACGAAGAGT AAGCCAATGT 16 80 

TATTTGTTAG TGTCGTTCCT ACTTTTTCGA CTTCGCCTAA CTTAACAGCA CCAGTACATA 174 0 

ATAATACAAA TAATAATACT AAACCGATTA CTGATGCAGG CATAGGAATT GGCATAAATG 1800 

ATTCAATTAT TTTCGATACA AAGAGTACTA AAGCAATTAC AATGACTTGG TGAAAAAAGT I86 0 

GTGCTGGTTT TGATGCGTCT TTTTGTTGTT TCACGACCAT TGCCTCCTAC GTTTGATTTA 1920 

ACTAAAGTAT AGATGGCTCA CTTCGATTTG CGTGATTTTT AGTCCGAAAT ACAAAATATC 1980 

ATAGGTAAAA TGCATAAAAA AAAGGATTAC TGTTAAAGTA ATCCTATCGA CGCTTTAAAA 204 0 

TCTTTCATAA ATGAACGTCC AACTTGCATC TTGACACCAT TTGTCAATAT TACCATATAA 2100 
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TGAATACGTA TAAAATAAGT GGGATTCAAT CGTTTTTCAT AACGATTCAA TGGCTCTGTT 
GTTTCGTATT TATGATTCGT TGTATGTATG GTTGTAATAC CATTATGTGT GCCAATCCCA 
ATAATATTTT GTTGCTTTAA CATGTGAATT TTATCGTCAA TTTCAACAGG TAAGCTTTGA 
TCAAAATTCG CCGACATATC ATTCGCAATT GCACTTGCGT TATTATCATC TTTGGCTTTA 
GTCGCACGCA CTTTATTGAC TGCTTGTTCA ATACGTTTTT GACCAAACGG TTTCAAAATA 
TAGTCTGTCG CATTTAATTC AAATGCCTGT ACTGCGTATT GGTCATGTGC AGTTGCAAAA 
ATAATCGCAG GTGGCTCTTT CATCTTTTGA ATCTTAGCTC CTAATTCGAT CCCATTTTCA 
TCCATTAAAT TGACATCTAA AAATATAATG TCATATTGAT TGATCAGTAG TGCTTCCAAT 
GTTTCTTTTA CATTTTCTGC CTCATTAATT TCTTCAAAAC CACCAATTTC ATTTAATAAA 
TATGTTAATT CATTACGTGC TAATGGCTCA TCATCTATGA TTAATGCTTT CATATTTATT 
CCTCCTCTTG TCTTTCATAA GGAAGTACAC ACCAAAAAGT GGTACCGCTC GATGTCGATT 
CAAATTGTAA TGCTGCGGAT TTTCCAAATA ATCCTTTTAG GCGTAAGTTT AAATTTTCTA 
AAGCACTACC AGTTCCAGAC TCTGATTCTA CAGATGTnTC TCCCaACAAA TGCATTTTAT 
CTTTAGAAAT ACCCTGACCA TTATCTTGTA CAATAATACG TACATGTGTT GCAGTTTCTT 
TAATCACTGA CACGTCAATA TCGTT 
(2) INFORMATION FOR SEQ ID NO: 179: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 1669 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

- (Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 179: 
ACAGAATTTC ACAGCATTTT TAGATGAAAA AATAAGCCAG TCATAGCGTT GATTTAACAA 
ATGAATATCA AAATTTAGTG GCTTTATATC AATAAAGGGT TTGTGAATAA TTGATACTAA 
ATCACTTTGC ATGTCATTTG TTTGTGTCAT AACTACAACT GGCTTCATAT TTAAACGTCA 
CTCCATTATT TAATGTTGTT CATTTAAGCG TTTTATAATT TCATAAGCAC CTTGCTCTTT 
TAATTTGTTA CTCACTGTTT TGCCTAACTC AACCGGATCT GTTCCGTTCA TTGTATATTC 
AAATCGTTCT TTACCATCTG GGGTCATAAT TAAACCTGTA AATTCGATTT CGTTTTGATC 
TGAGATTGTA GCATATCCTG CAATTGGCAC CTGACAACTA CCATCCATTT CTGCTAAAAA 
CGTTCGTTCA GCAGTCACAC ATTTTG CAAC CTCATCATTA TGTACTTTGC TTAATAATGT 
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5 



10 



15 



20 



TAACAATGTA 


TCTCTATCAA 


GATAAGATGT 


TnCAATATCA 


TCTGACCAGC 


CCATTCTTCT 


600 


TAAACCAGCT 


GCAGCTAAAA 


TAATCGCATC 


ATAATCTTCA 


GTTTGTAACT 


TTTCTAATCG 


660 


TGTATCTATA 


TTACCTCTAA 


TCCATTTAAT 


CTCTAAATTA 


GGATACTTAG 


ATAATATTTG 


720 


TGCACCACGA 


CGTAATGAAC 


TAGTACCAAT 


AATACTGCCT 


TCTGGCAATT 


GGGATAGTGG 


780 


TGTATGTGTT 


TTAGAAATAT 


ACGCATCAAA 


AGGTAATTCT 


CTATCAGGGA 


TACAACCTAA 


840 


TGTTAAACCT 


TCCGGAATTA 


CACTTGGTAC 


GTCTTTAAGC 


GAGTGTATTG 


CCATATCGAT 


900 


AiTrrrrrcA 


AAAAGTTCAT 


GTTGTATTTC 


TTTAACAAAT 


AAGCCTTTGC 


CTCCGACTTT 


960 


AGACAATTGT 


TTATCTACTA 


TACGATCGCC 


TTTCGTGaCA 


ATTTCTTTAA 


TTTCAATTTC 


1020 


TAGATTTGGC 


TCGACAGCTT 


TTAATTTATC 


AATAAATTGC 


TGGCTTTGTG 


TTAAAGCTAA 


^ 1080 


TTTACyTCTT 


CTGGAGCCAA 


CGACTrATTT 


ACGCATGTTC 


AATTCCTCCT 


AGGAACGGAT 


1140 


TGCTCTAGAT 


TATTTTCTCA 


ATTCACAAAA 


TGTGTTGCAA 


AAAATAAATT 


AATCATATTT 


1200 


AAGCAAAATA 


AAATAATGTT 


ATAGTATATT 


AAATATCTTG 


AATTCAACCA 


TTTGTTGATT 


1260 


CTAAGTAAAA 


TATAACTTCC 


ATATAATACT 


GTAATAATTG 


AAGAGAGTAT 


TACCTTCGGG 


1320 


TCAATGAATA 


TACGTTCACC 


AACTGAAATT 


ACACCCCACT 


GTGTACCTAA 


AATAATACTA 


1380 


AATATGAGAA 


TTATCCACCC 


ACTTAACGTT 


GAGTAAAACA 


CAATTGATTC 


AAGTGTAGCA 


1440 


ACGCTACCAA 


TTCTAAAGTA 


TTTTTGATCA 


AAACGTTTTT 


CCTTCAAATT 


ACGGTATTGC 


1500 


ATGATATACA 


GTAATGCATT 


GACAAAAGCT 


AAGGCAAAGA AGACATAACT 


TAACACAGCT 


1560 


AGACCGATAT 


GGACTAACAG 


TAACTCGTCT 


ACAACAGCAA 


TTTTCTGAAC 


CTTATTAGTA 


1620 


TAATGTGTCG 


G7TGAAATGT 


ATTCATCCCT 


AAnAGTGTTA ACCCTATTAA 


ATTCCAAGGA 


16B0 



AAAACACAG 1689 

(2) Information for seq id no: iso: 

(i) sequence characteristics: 
40 (A) LENGTH: 1209 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

45 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 180: 
nTGGnTGGCT TTTCCTATTG GACCAAATGG ACCnTTTACC TGGCCnTTCC CAGGACACCC 60 
$0 CGCTTGTGCC CACATTCCAA TCGGAAAAGG TGTATGTGGT ACAGCCGTTT CAGAACGTCG 120 

TACACAAATT GTAGCTGATG TTCATCAATT CGAAGGACAT ATCGCTTGTG ATGCTAATAG 180 
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CGATGCCCCT ATAACGGATC GATTTGATGA CAATGACAAa GAaCATCTTG AaGCAATTGT 300 

TAAAATTATT GAAAaGCAAC TCGCATAAAA GGACATCAGC ATTTTCAATA AAGTGTTGAC 360 

AGTTAGCAGG AAAATGTTAC AATAATCTTT GTGTGAATTA ACGAAAGTAG CAGTTGTATA 420 

TTATTGAGCG CTATGTTGTT CCCAATGCGG ACGTGTCACG TAACTGTCGC TATAAGGTGA 4 80 

AGACACATAA AACAATATAT CTTAGTAAGC ATGCAACACT CTT TTTT GTT TATTCATAAC 54 0 

AACAAAAAAG AATTAAAGGA GGAGTCTTAT TATGGCTCGA TTCAGAGGTT CAAACTGGAA 600 

AAAATCTCGT CGTTTAGGTA TCTCTTTAAG CGGTACTGGT AAAGAATTAG AAAAACGTCC 660 

TTACGCACCA GGACAACATG GTCCAAACCA ACGTAAAAAA TTATCAGAAT ATGGTTTACA 720 

ATTACGTGAA AAACAAAAAT TACGTTACTT ATATGGAATG ACTGAAAGAC AATTCCGTAA 780 

CACATTTGAC ATCGCTGGTA AAAAATTCGG TGTACACGGT GAAAACTTCA TGATCTTATT 840 

AGCAAGTCGT TTAGACGCTG TTGTTTATTC ATTAGGTTTA GCTCGTACTC GTCGTCAAGC 900 

ACGTCAATTA GTTAACCACG GTCATATCTT AGTAGATGGT AAACGTGTTG ATATTCCATC 960 

TTATTCTGTT AAACCTGGTC AAACAATTTC AGTTCGTGAA AAATCTCAAA AATTAAACAT 1020 

25 CATCGTTGAA TCAGTTGAAA TCAACAATTT CGTACCTGAG TACTTAAACT TTGATGCTGA 1080 

CAGCTTAACT GGTACTTTCG TACGTTTACC AGAACGTAGC GAATTACCTG CTGAAATTAA 114 0 

CGAACAATTA ATCCGTTGAG TACTACTCAA GATAATACGG TCAATACCAA CACCCACAAT 1200 
30 TGTGGGTGT 

(2) INFORMATION FOR SEQ ID NO: 181: 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 698 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 181: 

AAATCCCTTt GTtaAAgTsC AAAtTTTTCc AACrgCTTTA AtArGACCCA TATTACCtTC 60 

TTGGATTAAA tCmAGGaATG AcATACCACG ACCaCGTATC TTTTAGCAAT ACTTACAACT 120 

AAACGTAAGT TCGCTTCTGC AAGTCTTGAT TTTGCTACTT CATCACCTTG TTCAATACGT 180 

TTGGCTAATT CGATTTCTTC TTGTGCACTT AATAAGTTAA CACGCCCAAT TTCTTTAAGG 240 

TACATACGAA CTGGGTCATT TATTTTAACA CCTGGAGGGG CACTAAGATC ACTTGGATTC 300 

AGTTTCTCGT CAGTATCTGA ACTATCTTTT TCATTAACTA GTGAAATATC ATTATCATTT 360 
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GCAAT TT CTT CATGACTTAA ATGACCCTCT TTTTTACCTT TTTCAATTAA TTGCTTCTTA 4 80 

ACATCTTCTA ATGTTAATGT CGGATCAATT GTTTGTTTTT TAATTTTAAC TGTGTTATCA 540 

GACATGAAAC GGCCTCCCGA TTTTAAATAT GAACATTCGA AATTTATTCA ATATTGCTAT 600 

TTTAAACGAA ATTCTTAATT AATTCCATCC ATATTTTnAA TTTTATTTTA CAAATTGGGA 660 

ACTAAATCCC CAATATTTAT TTTTCAATAG TGGTGGTT 698 

10 

(2) INFORMATION FOR SEQ ID NO: 182: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5147 base pairs 
<B) TYPE: nucleic acid 

<C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

20 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 182: 

ACTTGATGAT GTATACAATG TATTTCAAGA ATATTATCAA AAAACATCTA ACATTAAGTT 60 

TTGTAGAATT CACAATTCTA GCTATTATCA CTTCTCAAAA TAAAAACATC GTTCTTCTTA 120 

25 AAGATTTAAT TGAAACAATC CACCATAAAT ACCCTCAAAC TGTTAGAGCT CTCAATAATT 180 

TAAAAAAGCA AGGCTATCTA ATAAAAGAAC GCTCAACTGA AGATGAAAGA AAAATTTTAA 24 0 

TTCATATGGA TGACGCGCAG CAAGACCATG CTGAACAATT ATTAGCTCAA GTGAATCAAT 300 

30 TATTAGCAGA TAAAGATCAT TTACATCTTG TTTTTGAATA ATATCTCTAT TACGCAAGTG 360 

TGCTGTATTC TAAAGTGCAC TTGTGTTTTC TATTTTTTAA TAAAACCTCA GCACATAATG 420 

AACAACTTTC TATTTTCTAT ATCACTTAAA ACCATTTCCG AAATTAAACC TCAGCACATT 480 

35 ~~ 

CAAAGCCCCA CTTTATTCTT AAAAATATTT TTTAACTCAT ATGTATTAAA CCGCTTTCAT 540 

TATAAAAAAT ATCTCTATAT TtTATCTGtT TtTATTAATC GAAATAGCGT GATTTTGCGG 600 

TTTTAAGCCT TTTACTTCCT GAATAAATCT TTCAGCAAAA TATTTATTTT ATAAGTTGTA 66 0 

40 

AAACTTACCT TTAAATTTAA TTATAAATAT AGATTTTAGT ATTGCAATAC ATAATTCGTT 720 

ATATTATGAT GACTTTACAA ATACATACAG GGGGTATTAA TkTGAAAAAG AAAAACATtT 780 

ATTCAATTCG TAAACTAGGT GTAGGTATtG CATCTGTAAC TTTAGGTACA TTACTTATAT 84 0 

45 

CTGGTGGCGT AACACCTGCT GCAAAtgctG CGCAACACGA TGAAGCTCAA CAAAATGCTT 900 

TTTATCAAGT CTTAAATATG CCTAACTTAA ATGCTGATCA ACGCAATGGT TTTATCCAAA 96 0 

so GCCTTAAAGA TGATCCAAGC CAAAGTGCTA ACGTTTTAGG TGAAGCTCAA AAACTTAATG 1020 

ACTCTCAAGC TCCAAAAGCT GATGCGCAAC AAAATAACTT CAACAAAGAT CAACAAAGCG 1080 
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AAAGTCTTAA 
ACGAATCTCA 
ATGAAATCTT 
TAAAAGATGA 
CTCAAGCACC 
TCTTACATTT 
ATGACCCAAG 
CACCAAAAGC 
ATTTACCTAA 
CTTCAGTGAG 
AAGAGGAAGA 
ACAACAAGCC 
GCAAAGAAGA 
GCAACAAGCC 
GCAAAGAAGA 
CTGGTGATAC 
CAGATAACAA 
AGAAGCAACC 
AAGAAAATCC 
CGTTATTAGC 
ATTTJATCCA 
TAAGAATCAT 
TTACTTTTCT 
CATTTTTAGG 
GATTCATGAA 
TTAGAATATT 
GTATTTTAAC 
CGCAATGGCA 
TGCCACAAGT 



AGACGACCCA AGCCAAAGCA 
AGCACCGAAA GCTGATAACA 
GAATATGCCT AACTTAAACG 
CCCAAGCCAA AGTGCTAACC 
GAAAGCGGAT AACAAATTCA 
ACCTAACTTA AACGAAGAAC 
CCAAAGCGCT AACCTTTTAG 
TGACAACAAA TTCAACAAAG 
CTTAACTGAA GAACAACGTA 
CAAAGAAATT TTAGCAGAAG 
CAATAACAAG CCTGGCAAAG 
TGGTAAAGAA GACAACAACA 
CGGCAACAAG CCTGGTAAAG 
TGGTAAAGAA GACAACAAAA 
TGGCAACAAA CCTGGTAAAG 
AGTAAATGAC ATTGCAAAAG 
ATTAGCTGAT AAAAACATGA 
AGCAAACCAT GCAGATGCTA 
ATTCATCGGT ACAACTGTAT 
TGGACGTCGT CGCGAACTAT 
AACCAATTTT AACTTATATA 
CTAAATGCAC GAGCAACATC 
AAACAACTTC TGAAACGCCT 
CATTAAAAAA TCGAACTAGA 
TAATTAGATT TAAAATGTCA 
AACGTTAGTA TAAACGTCCA 
GTCATTTTTA ATAATGCAGA 
ATTGATTGTG GTGAAATAAG 
AATGAACCGC TTGTTGAAAT 



CTAACGTTTT 
ATTTCAACAA 
AAGAACAACG 
TATTGTCAGA 
ACAAAGAACA 
AACGCAATGG 
CAGAAGCTAA 
AACAACAAAA 
ACGGCTTCAT 
CTAAAAAGCT 
AAGACAATAA 
AGCCTGGTAA 
AAGACAACAA 
AACCTGGTAA 
AAGATGGTAA 
CAAACGGCAC 
TCAAACCTGG 
ACAAAGCTCA 
TTGGTGGATT 
AAAAACAAAC 
CGTTGATTAA 
TTTTGTTGCT 
CAACACTTTC 
CAAGATGCTC 
TTTGAATCCA 
AACACAAATA 
TTCTTCACCA 
TTTCGCTGCT 
TTGTTGTGCC 



AGGTGAAGCT 
AGAACAACAA 
CAATGGTTTC 
AGCTAAAAAG 
ACAAAATGCT 
TTTCATCCAA 
AAAGCTAAAT 
TGCTTTCTAT 
CCAAAGCCTT 
AAACGATGCT 
CAAGCCTGGC 
AGAAGACAAC 
AAAACCTGGT 
AGAAGACGGC 
CGGAGTACAT 
TACTGCTGAC 
TCAAGAACTT 
AGCATTACCA 
ATCATTAGCC 
AATACACAAC 
CACATTCTTA 
CAGTGCATTT 
TACTCTGATT 
ATTG CATTTC 
AGTGACAACA 
AAAGCAACAA 
ACTTTTTTAA 
ACACCACCTG 
ACTGTCGCTT 



AAAAAATTAA 
AATGCTTTCT 
ATCCAAAGCT 
TTAAATGAAT 
TTCTATGAAA 
AGCCTAAAAG 
GATGCTCAAG 
GAAATTTTAC 
AAAGACGATC 
CAAGCACCAA 
AAAGAAGACA 
AACAAGCCTG 
AAAGAAGATG 
AACAAGCCTG 
GTCGTTAAAC 
AAAATTGCTG 
GTTGTTGATA 
GAAACTGGTG 
TTAGGTGCAG 
GATAGATATC 
TTTGAAATGA 
TTTATTTTAC 
ACATATATGA 
GTACTAGTTC 
TTATTTATAT 
ATATAATACT 
CAGCTGCAGT 
CAGTGTTAGC 
GAATAGGTGC 



1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 

1800 

1860 

1920 

1980 

2040 

2100 

2160 

2220 

2280 

2340 

2400 

2460 

2520 

2580 

2640 

2700 

2760 

2820 

2880 



55 



865 



10 



15 



EP 0 786 519 A2 

TGGAGAGAAT AATGGGAAAA TTGCTCCCGC TTTAGCAATA CCTTGTCCAA TTGCTACAGT 3000 

CAAACCACCG TATGTCATAA CTTTAGCAAT AGCTAGGATA GCTGAAATTG TAAGGATCGG 3060 

TAACCATAAT TCTTTAATTG CTTCGACCAA TAAAGCACCT GCACTTTTCC ATTTTAACTT 3120 

CGTAATTAAA ATTGTAATAA TTACTGTTAA TAAAATCGCT GTCCCAGTTG CACCAATTAA 3180 

ATCGAGACGC AACGCAATTC CTTTAGGCGA TAAATCACTC ACAGTATTTG GAATTGGCAA 3240 

TTTTATTACT AAACTTTCAA GTGCACCTCC AGGTTGGAAT AATTTTTTGA AGAATGGTGC 3300 

ACTCCATACT AATACAAAGG CAGTTAAAAT TACGAACGGA CTCCAAGCAA AGACAATTTC 3360 

TTTAGGCGTT CGTTTTTGAA TTTTATGTTC AGACGCTTCC AATCTGAAAA TGTTTTTCGG 3420 

TTTAAATTTA CGACAAACAA ATGCTAACAC CACCATTGTT GCTAGTGATG GAATAATGTC 3480 

TGCTAGTTCT GGACCATGGA ATATTGTTAA TAATAATTGT AATCCAGTAT ATGTACCACT 3540 

20 CACTGTTAAA ATGACAGGTA AAATTTCTTT AATACCTTTC ATACCATCTA CAATGAATAC 3600 

TAAAACAAAT GGAATAATAA AGTTTAAAAT TGGAAGTGTT AATGCTGAGT ATCTCGCAAC 3660 

ATCTAATGTT GTAACGCCTC CACTTAAGTT AAACGTATCA ATAATACTAA CTGGTAAACC 3720 

AATTGCACCA AAGGCACCCG CCGCACCATT AGCAATTAAA CATAACATCG CTGCTTTTAA 3780 

TGGTTCAAAT CCAAGTTGAA TTAATAATAC TGCACAAATC GCAATTGGCA CACCAAATCC 384 0 

TGCTGCACCT TCTAAAAATG CGTTGAAACA AAATCCAATT AATAATAGTT GGATTCTTTG 3900 

GTCCACTGAA AT ACTTG CAA TACTATCTTG AATAATAGAA AATTGTCCTG TTTTAATAGA 3960 

AACTTTATAT AACCAAACTG CCATTAAAAC GATATATCCT ATTGGGAAAA TACCGGCAAC 4020 

35 AACGCCTTCT GTAATCGCAC CTGCTGATAC ACGCGCTGGT AATTCAAATA CAAATAAAGC 4080 
CACAATCAAT GTAACAACCA AAGTTGTCAA TGCTGCATAA ATGCCTTTCA TTTTAAAAAC % 414 0 

ggttSagcat AATAAAAATA AAATAATAGG TACTGCTGCA ACTAAGGCTG ATAATCCGAC 4200 

ATTATCGAAT GGATTTACAG TAAGTAGTGT CATAATGACT CCCTCTCTTT ATATAAAATA 4260 

TTTATCATTC TGATTAATCT ACAACCTATT TCAACTTATA TTTTGCGATG ATCACATATT 4320 
TAAAATGTAA CACTCCTATA TGTGACAGGC AATCGAATTT TTACAAAAAG TTCACAAAAT . 4380 

ATACACAATA TTTAACTATA ATAmATAATA TATCaTntTA ATTATAAATA CTAGATATTA 4440 

' TTTATAATAA TCTCAGGAAT TCGCTTCAAA ACTGCATCAT GAGAGTTTAT ATTTTTATTG 4500 

AGAATCTCTC ATTTTATGAA TTGTAGGAAG TAAACAAAAT ATGACAAGCG TCAAACCAAT 4560 

GATAATGATA AATATCATAT TAAACCATAG TAAATTGAAT TGATGATGGT GTTGTATTTG 4620 

CCAAATTTCT AATACTGTGA AGATAGACAT ATAGCTCATA ATCTCTAAAT TTAACGTACT 4680 
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AAATCGTTCA TAGTATCTAC CTGCAATGAA AAATATAAGC CAAATCACTA TAAATGCGCT 
ATTAATCAAA AGCAGCACCC ATTTATCAGC AAAATTATCA GCATCCCCTG CTAAATTATA 
ATGAATAGGC ACTTTGGTTG GTAATTTTGG ATAGGTCACT ACTGTATAGC ACATCATAGC 
TAAGTAAATA AGTAGACTTA ATATTGTAAA AGACCTGATT TTAGACATTC TATCGCCTcT 
TcTTTACATT TTATGTATAA CACTCTGCCT ATTTTACCTT TTAATaCATT ACCCCAAcGA 
TtAAaCAATA tGTAaTGATA CTATAATTGC GTCAGGAGTA TCCGCTTGTT AAATGTGCAT 
AGCTTATATT TAGCTGTTTA ACATGCCACA TAATGATTCG AATTATT 
(2) INFORMATION FOR SEQ ID NO: 183: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1312 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: J 
CACTTACTTC CACCATTATC ATAACTTTAA 
AGGCGTCGCA CCTACACCAA CACCATCCAA 
TCAGCAGCAA CTTTCACnTG CGTAATACAA 
CCAGTTACTC TAAGTCGTGG ATATGTTTGT 
TGAATATGAC CGACATGGTA CTGTGGCATA 
TCAGGATCAC CTTTAAATGT CATCATTTGA 
TCATTATCTG TATGATCATC AACCACAGTA 
AAAACCTTAC CTTCCGGTGT AGTAAATGGC 
ATGTCTGTAT CACTCGTTCT CGCAATTACG 
TCTTTTTCAT CAAATGCCAA TACAACAGTT 
TAATCAAATG CTGGATCTTG TCCGAACCAA 
AATACGCCAT CATACACTTC TTCTAGTTGA 
GATGTAATTA TATCATCCAC TGACGTATTG 
TCTTGTTCTA ATGCTTCAAT AAATGAGCTT 
TTCGGTGCGC CAGGATATAA TTGTCTTTGT 
CCTTTTATCA GACTTCCGAA TGCCTCTTCT 



!EQ ID NO: 183: 

AATGGATATA nTTCATCAAA CATTATCTAA 
CAATTAACTT ACAACTCTGC GATTACTTCT 
TCAGGTAGTC CAACCGCTTC AAAAGATGCA 
TTAATATGTG CTTGAATCTG TCTAATTTGT 
CTTTTCGGCA AACGATTGAC AATTGTAAAT 
CTTAAATCTC TACGTACAAT CGATACTAAT 
TCACCTGGTT TACCTACATA CGCACGAATC 
CATTTTTTCG ATGTCCAAGT ACATGCGGTA 
AAGCCAGTAC CATCATGGGT ATTTTCAATG 
GCAACAGTCG TACTATCCAT CGTTTTAAAG 
TTTAAAAACA CTTGATGTGG TGTCGTTACT 
TCATTGTAAA CAATTTTATA TTGTTTTTGA 
TAGCGTATTG TCACACCTTT ATTTTTAACA 
AAACCATGCT TAAATTGTTT GAATTGTCCT 
TTCAGACGCT TATTTTTCTC ATCCTTCATA 
TTTTCTTTAA AATTAGGAAA CGTACTCATC 
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TCAAGTACCT CATTACCTAA TCTTGCTCTG AAAAATGCAC CAACAGAAAT GTCACCATCC 



1080 



TGCATTTGAG TAGGTTTTTT TAATAAATCA AACCCTGCTC TTAATTTACC AAGTGGCGAT 



1140 



ATTAATTTTG TAGTAACAAA TGGTTTAATA TCTGTTGGAA TACCCATAAT TGAACCACCT 



1200 



GGAATCGGAT ATAATTTATT TTTCGCAAAA ATATATGATT GTCCAGTCGT ATTTGTAACA 



1260 



ATATCTTGTT CTAATCCAAT ATCTTTCGCT AATTCTGTCA TAATCGTTTT TC 
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(2) INFORMATION FOR SEQ ID NO: 184: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6157 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 184: 

TTTTACAATA AAAATATGAT ATACTACTTG TCGTATATAA GGAACGGAGG ACAATTTATG 60 

CATACATTTT TAATCGTATT ATTAATCATT GATTGTATTG CATTAATAAC TGTTGTACTA 120 

CTCCAAGAAG GTAAAAGCAG TGGACTTTCA GGTGCCATCA GTGGTGGTGC TGAGCAGTTA 180 

TTCGGTAAAC AAAAACAACG TGGCGTCGAT TTATTCTTAA ATAGATTAAC AATTATTTTA 240 

TCAATATTAT TTTTTGTACT TATGATTTGC ATAAGTTATC TTGGTATGTA AGGTCCGGCG 300 

ATGTAAATGT CGGGCTTTTT TATTTATAAT TAAGAATGTA ATAGTTTAAC AATAAGCTAT 360 

GTAAAATATA TAGCCTAGTT AAGTATGCAA AGGGAGCGTT AGATTTATGC AGATAAAATT 420 

ACCAAAACCT TTCTTTTTTG AGGAAGGTAA ACGTGCCGTG TTATTACTAC ATGGTTTTAC 480 

AGGCAATTCG TCTGATGTTC GTCAATTAGG TCGATTTTTA CAAAAGAAAG GTT ATA CATC 54 0 

ATATBCACCG CAATATGAAG GCCACGCGGC ACCACCAGAT GAAATACTGA AATCTAGTCC 600 

TTTCGTTTGG TTTAAAGATG CGTTAGATGG TTATGATTAT CTTGTTGAAC AAGGTTATGA 660 

TGAAATTGTT GTTGCTGGTC TATCATTAGG TGGGGATTTT GCTTTAAAAT TAAGCTTAAA 720 

TAGAGATGTA AAGGGTATTG TAACGATGTG TGCTCCTATG GGTGGCAAAA CTGAAGGTGC 780 

CATTTATGAA GGCTTTTTAG AATATGCACG CAATTTTAAA AAGTATGAAG GTAAAGATCA 840 

AGAGACTATT GATAATGAAA TGGATCATTT TAAACCAACT GAAACTTTAA AAGAACTAAG 900 

TGAAGCATTA GATACGATTA AAGAGCAAGT TGATGAAGTG TTGGATCCTA TTTTAGTGAT 960 

TCAAGCAGAA AACGACAATA TGATTGATCC ACAATCCGCA AATTATATAT ATGACCATGT 1020 

AGATTCTGAT GACAAAAATA TCAAGTGGTA CAGTGAATCT GGACATGTTA TTACGATTGA 1080 
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AGAATAAAAA GAGATTTTAA CATTAGAAAG 
AGAAGAGATT ATTAATCAAC CTGAATATGA 
5 ATTAGGTTTA AGCAGTGCCG ACTCGTTTAG 

ACAATCAGGA TTAATCGAAC GTACAAAAAC 
AGGTCAATCA AAATTGATAA AAGGAACGTT 

10 

AAGACCTGAA GATGAGGATA TGGAAGATAT 
CTTGGATGGA GATACTGTTA TTGTAGAAAT 

15 AATCGAAGGG GAAGTTAAGT CGATTGAGAA 

TAGTGAAGCT AGACATTTTG GCTTTGTTAT 
TTTCATTCCT AAAGGTCAAA GTTTAGGCGC 

20 TACTAAGTAT GCTGATGGTT CAGATAATCC 

TAAAAATGAT CCTGGCGTAG ATATTTTATC 
ATTTCCTGAT GAAGTGTTAC AAGAAGCTGA 

25 AATTAAAGGC CGTCATGATT TACGTGATGA 

TAAAGACTTA GATGACGCAA TTAGTGTTAA 
TGTAAGTATT GCTGATGTCA GCTATTATGT 

30 

ATATGATAGA GCGACAAGTG TATATCTTGT 
ATTAAGTAAT GGTATTTGTT CATTGAATCC 

3S CATGGAAATC GATGCTAGTG GTCGCGTTGT 

TTCTGATTAT CGAATGACGT ATGATGCGGT 
CATTCGCGAA CAATATAATG AAATTACGCC 

40 TCGTTTGATT CAAATGAGAA AACGACGTGG 

AGTATTAGTT AACGAAGACG GTATACCAAC 
TGAACGTCTA ATTGAATCAT TTATGTTAAT 

45 

TAAGTTAGAT GTACCTTTTA TTTACCGAGT 
ACAATTCTTT GATTTTATTA CAAACTTTGG 
so TCATCCAACA ACACTTCAAA AGGTTCAAGA 

CATTTCAACA ATGATGTTGC GTTCAATGCA 
ACATTTTGGC TTATCAGCTG AATATTATAC 
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GAGGGGCATA ATGAATTTAA AGCAATCTAT 1200 
ACCTATGTCA GTGTCAGATT TTCAAGATGC . 1260 

AGATTTAATT AAGGTGCTTG TGGAGTTAGA 1320 

AGACAGATAC CAAAAAAAGC ATAGTTATAG 13 BO 

AAGTCAAAAT AAAAAAGGCT TTGCATTCTT 1440 

ATTTATTCCC CCGACGAAAA TTAATCGTGC 1500 

CCATCAATCA AAAGGTGAAC ATAAAGGTAA 1560 

GCATTCTGTA ACTCAAGTTG TTGGTACGTA 1620 

TCCGGATGAT AAACGTATTA TGCAAGATAT 1680 

AGTCGATGGT CATAAGGTAC TTGTACAAAT 1740 

AGAAGGACAT ATTTCTGCTA TTTTAGGACA 1800 

TATTATCTAT CAACATGGCA TAGAAATTGA 1860 

AGCAGTACCT GATCATATTG AAAATACTGA 1920 

ATTGACAATC ACAATTGATG GTGCTGATGG 1980 

AAAGTTAGCG AACGGTAATA CGCAATTAAC 2040 

AACAGAAGGT TCTGCATTGG ATAAAGAGGC 2100 

TGACCGTGTA ATTCCAATGA TTCCACATCG 2160 

TAATGTTGAT CGTTTAACTC TAAGCTGTCG 2220 

TAAACATGAA ATTTTTGATA GTGTTATACA 2280 

AAATCAGATT ATTACTGAAA AGGATCCTAA 2340 

TATGCTAGAT TTAGCACAAG ATTTATCTAA 2400 

TGAAATCGAT TTTGATATTA GTGAAGCAAA 2460 

AGATGTTCAA TTAAGACAAC GTGGCGAGGG 2520 

TGCAAATGAA ACAGTTGCTG AACATTTTAG 2580 

GCATGAGCAA CCTAAATCAG ATCGCTTAAG 2640 

CATCATGATT AAGGGTACTG GCGAAGATAT 2700 

AGAAGTAGAA GGTCGACCTG AACAAATGGT 2760 

ACAAGCGCAT TATGATGATG TGAACTTGGG 2820 

GCATTTTACA TCACCAATTA GACGTTATCC 2880 
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AGAAGTGAAG CGTTGGGAAG ACAAATTGCC 
ACGTCGTGCT ATTGAGGCAG AACGTGATAC 
5 TCAACATATT GGTGATGAAT TTGAAGGTAT 

CATTGAATTG CCAAATACGA TAGAAGGTAT 
TTACCGTTTT GAAGAGCGTC AAATGGCATT 

10 

AATTGGTGAC ACAGTTAAGG TTAAAGTGAC 
TTTTCAAATT GTAGGTATGC CTTTACCGAA 
TAAGACAATT CAAGCCAAAA CGCGTGGTAA 

15 

GGGTCGTAAG AAAAAAGGTA AGCAACGTAA 
AGGTAATAGT AAGCATAAGC CATTTTATAA 

20 TAAGAAAAAA TAAGCAGCAA TGAGGTGAGT 

ATTAGCGGAA AATCGTAAGG CAAGACATGA 
AATTGTATTG CAAGGCACAG AAATAAAATC 

25 TAGTTATGCG CAAGTTAAAA ACGGTGAAAT 

CGAAGAAGGG AATCGTTTTA ATCACGATCC 
GCGTGAAATC ATTAAATTGG GTGATCAAAC 

30 

AAAGCTTTAT TTGAAGCATG GACATTGTAA 
AAAATATGAT AAACGTCAAG CTTTGAAAGA 
TATGAAAGCC CGTTATTAAG CGATTTAGTT 

35 

ATGTGCTTTT GTAAATTACA AAAGTATGAT 
TGGA3TCGAC AGGGGTCCCC CGAGCTCATT 
40 ACACACACAG TTTATAATAA CTGGCAAATC 

GCACTCTGCA TCGCCTAACA GCATTTCCTA 

GATATGCTAA ACACTGCCGT TTGAAGTCTG 

45 

TGTTGGTTGT TTATCACTTT TCATGATGCG 

GATGTGTATC AGGACCTTTG GACGCGGGTT 

ACAGCCTTTG TGGTTGTGGG CTTTTTTATT 

50 

AATTTGTTGT GAGTATTGAT ATAGCAGTGT 
AGTAATAAGT GATTATGAAT TAGTTTTTGA 
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TGAGTTAGCT GAACATACTT CTAAACGTGA 3000 

TGATGaATTG AAAAAAGCAG AATATATGAT 3 060 

TGTCAGCTCA GTAGCTAACT TCGGTATGTT 3120 

GGTTCATATT GCGAATATGA CTGATGATTA 3180 

AATTGGTGAG CGTCAAGCTA AAGTATTTAG 3240 

GCATGTTGAT GTAGATGAAC GATTAATTGA 3300 

AAATGATCGA TCACAGCGCC CAGCGCGAGG 3360 

ATCATTAGAT AAATCAAAAT CTGATGATAA 3420 

AGGTAAAAAC CAACGTAATA ATGATAAATC 3480 

AGATAAAAGT GTGAAAAAGA AAGCACGTCG 3540 

ATGAATGGCT AAGAAGAAAT CACCAGGTAC 3600 

TTATAATATT GAAGATACGA TTGAAGCGGG 3660 

AATTCGCCGA GGTAGTGCTA ACCTTAAAGA 3720 

GTATTTGAAT AATATGCATA TAGCACCATA 3780 

TCTTCGTTCT CGAAAATTAT TATTGCACAA 384 0 

ACGTGAGATT GGTTATTCGA TTGTGCCGTT 3900 

AGTATTACTT GGTGTtGCAC GAGGTAAGAA 3960 

AAAAGCAGTC AAACGAGATG TTGCGCGCGA 4020 

GCTTAATCGG GCTATATTTG ATATAGTTAT 4080 

TTGTTTGATT TATTATTTCG GGGACGTTCA 4140 

AAGCGTGTCG GAGGGTTGTC TTCGTCATCA 4200 

AAACAATAAT TTCGCAGTAG CTGCCTAATC 4260 

TGTGCTGTTA ACGCGATTCA ACCTTAATAG 4320 

TTTAGAAGAA ACTTAATCAA ACTAGCATCA 4380 

AAACCTATCG ATAAACTACA CACGTAGAAA 4440 

CAAATCCCGC CGTCTCCATA TTTGTAGCCT 4500 

TTGTGTTTTT CAGGGGATAA TGCATTGCAG 4560 

TTGTATAGGT GTTTATTTGA TGGAGGAAAG 4 620 

GATATAAGGG GACAGTGATG TGTGTCAAAT 4680 
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TTATACGCAA AAAATTCTCC ATGTTATATA TGTCAATATA AAAATGTGAA TCGTCTACAC 4 800 

TTAATTGGAT AAATGGCTAC TGAAAAAGAA CTTTTCATTT TTGTTACGTC ACTAAGTGGG 4 860 

TGTAGTTATA AAGAGATGAG CCGAGTTTTG ATATTTTCAT TAGAATCAAT ATGCCTATTA 4 920 

ACACAATCAG CAATAGTTGA CGAGACGGAA ATAAAAGAAG TCGTAGTTAA GAAATGCATT 4980 

TCACAACATA CCATTGTAGC CATTTTTATT GTTTTGGATG ATAAACTCTT TTTGGAATTT 5040 

TTAGTTTTTA TAATTTGCAA CTACACTACT TCTTTTACTA ATATTAATGT CTAAGTAATC 5100 

GATAAAAAAT TTTCCATTGA ATAAATGAGA AGTTAAAAAC TTTACTTAAC CTTTCycATT 5160 

GCATTTTCCT ATTCACGATT TTAAGAACCC AACATACTAC AAACGAATTT TAAAAGGCGA 5220 

GAGTAAAGCT TACTTGTTTA TTATACATAT TTAAAATCCA AGAGTCAGAA CAGACTACTC 5280 
CTCTTTATAA CTATAAAAAA TAGCTATGAA AAAATCTATC GTCATAGATT CCTTCATAGC . 5340 

20 TAATCTTAGT ATGTTTATTT TTATTTTAGG ATGCTATTTA TCAACTCAAC ATATAACTCA 5400 

CTATTTTTAT AACCTTCTAA TATATCATTA ACTTGTCTAA TAGGTATTTC TGGTACTTCT 5460 

CTAATGTTTT CCAATTTTGT TTTAAATTGT TTTTTTGTTA TTTGCTCTTT ATTTGTAGCC 5520 

AATTGGAACA AGTAAGAATC TAGCATATTA ATTTCTTTAT ATGAATACAT ATATCTTAAT 5580 

AACACTAAAT CTCTAGTTTT TAAGTTAGGC GCTAGTTCTT CTTGTAATTG TTCTATTGAT 5640 

TGTyTCATTA ATAACAATCT CATTTCTAAT TCTTCATTAT TCATTTTATC ACACTCTTtT 5700 

TATATTAATG CTTGACCAAC TTGGGAAACC CAAAACCCTA TGCTTCTTGC AGTAGAATCT 5760 

TTAATACCAG TTCCCATCAA TGCTTGTGAA ACTTGACCTT GTACATTTCC CCATGTAGCC 5820 

35 TCTTCTTGTT TTAATGCATT ATTCAATGCG GGATTTACAA ATTTATCCCA TCTTTTTTTT 5880 

ATGATTTTCC GGCACGGGGA CTGATTTCTT TAACACCATT AAACACAGAT TTTTTATTTT 5940 

TAATTATAGC TTTATAGTAT CATGTTGGCT AAGCTATAAA TAAGTCAGTT TCTCTAAAAA 6000 

TTAAATAACT GAATGTAAGA CAATCAACAA wCCAAATTTA TACTTCATCT AAACCACTGT 6060 

GGTCGTCATC TTTTTGCTTT TCTTTTTCTT TCTCTCGTTC TTGTTCTTTT TTGTACTCTT 6120 

CTTCAAATTC TTTTTCTTTC TTTTCTACTT CTTCTCT 6157 
(2) INFORMATION FOR SEQ ID NO: 185: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 884 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 
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CATTTGTTAT TCTGAGTAGC CAATTTGGCA AAGATGAACA AACGTCTGAA CAAACGTATC 60 
AAGTTGCAGT CGCATTAGAG TTAATTCATA TGGCAACACT TGTTCATGAT GACGTTATTG 120 
5 ATAAAAGCGA CAAGCGTCGA GGCAAGTTAA CCATATCAAA GAAATGGGAT CAGACAACTG 180 

CTATTTTAAC TGGGAATTTT TTATTGGCAT TAGGACTTGA ACACTTAATG GCCGTTAAAG 240 
ATAATCGTGT ACATCAATTG ATATCTGAAT CTATCGTTGA TGTTTGTAGA GGGGAACTTT 300 

10 

TCCAATTTCA AGACCAATTT AACAGTCAAC AGACAATTAT TAATTATTTA CGACGTATCA 360 
ATCGCAAAAC AGCACTGTTA ATTCAAATAT CAACTGAAGT TGGTGCAATT ACTTCTCAAT 420 
CTGATAAAGA GACTGTACGA AAATTGAAAA TGATTGGTCA TTATATAGGT ATGAGCTTCC 480 

15 

AAATCATTGA TGATGTATTA GACTTCACAA GTACCGAAAA GAAATTAGGT ' AAGCCGGTCG 540 
GAAGTGATTT GCTTAATGGT CATATTACGT TACCGATtTT ATTAGAAATG CGTAAAAATC 600 

20 CAGACTTCAA ATTGAAAATC GAACAGTTAC GTCGTGATAG TGAACGCAAA GAATTTGAAG 660 

AATGTATCCA AATCATTAGA AAATCTGACA GCATCGATGA GGCTAAGGCA GTAAGTTCGA 720 
AGTATTTAAG TAAAGCyTTG AATTTGATTT CyGaGTTACC aGATGGACaT CCGaGAtCAC 780 

25 TACyTTTAAG TTTGACGAAA AAAATGGGTT CAAnAAACAC GTAGTATTTA TGnAAAAGTA 840 

TTGAAAGCGC TTTACCAACC TGTTAATATA TAATAGTAAT ATAC 884 
(2) INFORMATION FOR SEQ ID NO: 186: 

30 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6876 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

35 

~ (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 186: 

40 AATTTCATCT GCTCGTGCAA AATCTTTGTT TTTCCTTGCT TCATTACGCT CTTCGATTAA 60 

TTTTTCAACA TCTTCATCCA ATAATTCATC TGCATTTTTA GATTTTAACG GTACACCTAA 120 
AACATCGCTG AAAATTTGAT AAACTGCTTT AAATTTATCA ATTACTTCTG TTGATGTTGT 180 

45 GTTCTCTAGT ACATATTTAT TCGCAAGTkT TGCTAAATCA TACCAAGCTG TAATTGCATT 240 

AGCTGTATTA AAATCATCAT TCATAACTGT TTCAAAACGA TTTAAAATCG CATCAATTTG 300 
ATCAATATAT GTCTGTTGAT TTTCAATATT AGTAGCAATT TGTGCGCGCT CTTCAATTAA 360 

50 

TTGATAACTA TTGCGAATAC GCTCTAGTcC aCTACGTGCT GATTCTACCA ATTCTAGATT 420 
ATAGTTAATT GGGCTTCTAT AATGTACGCT AATCATAAAG AATCTTAGTA CATCTGGATC 480 
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ATTATCAATA 


TTAATGAAAC 


CATTATGCAT 


CCAATAATTA 


GCAAATGGCG 


CATGATTATG 


600 


TGCTTCTGAT 


TGTGCTATTT 


CATTTTCATG 


ATGTGGAAAT 


TGTAAATCTG 


AACCACCCGC 


660 


ATGTATATCA 


ATTGTAGGTC 


CTAGCTCATG 


AAATGCCATT 


ACAGAACATT 


CTATATGCCA 


720 


TCCTGGTCTA 


CCTTCACCAA 


ATGGGCTATC 


CCAACTAATC 


TCGCCAGGTt 


CGCTTTTTTC 


780 


CACAATGTAA 


AATCAAGTGC 


ATCTTCTTTA 


TGCTCTCCTG 


CATCTATACG 


AGCACCCACT 


840 


TTTAAGTCAT 


CTATGGATTG 


ATGACTTAAT 


TTACCATAAC 


CTTCAAATTT 


ACGTGTTCTA 


900 


AAGTAAACAT 


CGCCACCACT 


TTCATATGCA 


TAACCTTGAT 


CCACCAAATC 


TTTAATAAAT 


960 


TGAATAATGT 


CATCCATATG 


GTCCATTACC 


CTTGGATTTG 


AAGTCGCTTT 


TCTAACATTT 


1020 


AACGCACCAA 


CATCTTCATG 


AAAAGCAGCG 


ATATATTTTT 


CTGCAATTTC 


GGGAACAGAC 


1080 


TGATTTAATT 


CTTGAGAACG 


TTTAATTAAT 


TTATCATCTA 


CGTCTGTAAA 


ATTTGATACA 


1140 


TATTCTACAT 


TATATCCTTG 


GTATTCAAAG 


TAACGTCTCA 


CTACGTCATA 


ATTAATTGCw 


1200 


GGTCTTGCGT 


TACCAATATG 


AATGTAGTTA 


TATACAGTAG 


GACCACATAC 


ATACATTTTT 


1260 


ACTTTCCCTG 


GTTCTATAGG 


CTTGAACACT 


TCTTTTTGAC 


GTGTAAGCGT 


ATTATATAAT 


1320 


GTAATCATCT 


TGAATCTCTC 


CATTCCTAGT 


CTTTTCAAGT 


TGTCGTTCTA 


AATGCTTAAT 


1380 


TTGTTCATAA 


ATTGGATCAG 


GTAGATGGCG 


ATGATCAAAT 


GTTTTTCCAA 


CTCGAACACC 


1440 


ATCTTGCTTA 


ACAATATGTC 


CTGGTATACC 


AACAACCGTT 


GAATAACTTG 


GAACTGATTG 


1S00 


TAAAACAACT 


GAATTTGCAC 


CAATATTTAC 


ATTTGAATTT 


ATTTTAATAT 


TTCCTAAAAC 


1560 


TTTCGCACCG 


GCTGCTATTA AAACATTGTC 


TCCTATATCT 


GGGTGTCTTT 


TCCCTCTTTC 


1620 


TTTCCCTGTC 


CCACCAAGTG 


TCACGCCTTG 


ATAGATTGTC 


ACATTATCAC 


CAATTGTACA 


1680 


TGTTTCTCCT 


ATTACAACGC 


CCATACCATG 


ATCTATAAAT 


AGACGCTTTC 


CAATTTTAGC 


1740 


ACCTGGATGG 


ATTTCTATAC 


CTGTGAAAAA 


TCTTGAAATT 


TGAGATATCG 


CGCGTGCTGC 


1800 


AACATATTTT 


TTTTGGTTGT 


ATAACTTATG 


TGCAATCAAA 


TGACTCCAAA 


CTGCATGTAA 


1860 


ACCTGCATAC 


GTTGTAATGA 


CTTCTAATGT 


TGAACGTGCC 


GCTGGATCCT 


GCTCAAATAC 


1920 


CATTTTTATA 


TCGTCTCTCA 


TTCTTTTTAA 


CAAGATCATT 


TCCTCCTCAA 


TGATTGAACT 


1980 


ACGTAAATAC 


ATAATTGAAG 


TACCTGCGAA ATTAAATATC AAAAAAGCAC 


CACTAACATA 


2040 


CAAATTGTAT 


TGTTAGAGGC 


GCTTCCGCAC 


GGTTCCACTC 


TGAATTTAGC 


GAATAACATT 


2100 


AATAATATTG 


CGGGCGCTTC 


CAAATTATCA 


AGGAAACTAA 


GTCAACTTAA 


TGCTCATCAC 


2160 


TCTCATTATA 


TATTTAATTC 


ATTTTACGAA 


GGTGCATTCA 


TTAATTTCTA 


CGTTGTACTC 


2220 


ACAGCAACCG 


TACACTCTCT GCATCGTATA AATTTAATTA 


CTAATCCTTC 


GTTTTATATA 


2280 
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ATAAAATTCA AGTATATACT ACCTTGATCT TGTCTATTTC ATTACTTATA TTGTTTTAAA 24 00 

CGGTTTAGCA CTTTTTCTTT ACCAAGTACT TCAATTGTAT TTGGTAATTC AGGACCATGC 2460 

ATTTGGCCTG TTACAGCAAC ACGAATAGGC ATAAATAATT GCTTGCCTTT TATTCCTGTT 2520 

TCTTTTTGAA CTTCTTTAAT TGTCTTTTTA ATTTCAGCCG CTTCAAATGG TTCAAGTGCT 2580 

TCTAATTTAC TGAATAAGTG CGTCATTAAC TCTGGTACTT GCTCTCCATT AATCACTTGT 2640 

TGTTCTTCTT CACCAAGAGC TGGCATTTCT TTAAAGAACA TTTCTGATAA AGGTACAATT 2700 

TCACCGGCAT AACTCATTTC TTTTTGATAA AGCGCAATTA ATTTGCGTCC CCAAGATAAA 2760 

1S TCCTCTTCTG ACGGCACCTC AGGAATCAAA TTTGCTTTAA TTAAATGAGG TAATGCTAAT 2820 

TGGAATACTG TTTCAGTATC TTTTTGTTTC ATATATTGGT TATTAACCCA TGCTAATTTT 2880 

TGCTTATCGA AAAATGCTGG TGATTTTGAC AAACGCTTTT CATCAAAGAT TTTGATAAAT 2940 

20 TCTTCTTTAG AAAAGATTTC TTCTTCACCT TCAGGAGACC AACCTAATAA CGCAATAAAA 3000 

TTAAATAACG CTTCAGGTAA ATAACCTAAG TCACGATATT GCTCAATAAA TTGTAAAATT 3060 

TGCCCATCAC GTTTACTTAA CTTTTTACGT TCTTCATTAA CAATTAATGA CATATGACCA 3120 

AAACGAGGTG GCTCCCAGCC AAATGCTTCA TAAATCATAA TTTGTTTAGG CGTGTTTGAA 3180 

ATATGATCAT CACCACGAAT TACATCTGAA ATTTGCATGT AATGATCATC TATAGCTACT 3240 

GCAAAATTGT ACGTTGGAAT GCCATCTTTT TTTACGATAA CCCAGTCACC AATACCATTT 3300 

GAATCAAATG AAATATTTCC TTTTACCATA TCATCAAATG AATACGTTTG GTTTTGAGGT 3360 

ACTCGGAAAC GAATTGATGG TTGGCGTCCT TCTGCTTCAA ATTGTTGACG TTGTTCTTCA 3420 

GTCAAATGCG CATGTTGACC ACCATAGCGA GGCATTTCAC CACGAGCGAT TTGCGCTTCA 3480 

CGTTCAGCTT CTAATTCTTC TTCTGTCATA TAGCATTTAT ATGCTTTATC TTCTGCTAGT 3540 

AACTGATCTA TTAATGGTTG GTAGATATGT TGACGTTCAG ATTGACGATA TGGTCCGTAG 3600 

40 CCATTGTCTT TATCTACAGA CTCATCCCAA TCTAATCCTA ACCATTTAAG ATTATCAAAT 3660 

TGTGATGTTT CTCCATCTTC TAAATTACGT TTTTTATCAG TATCTTCAAT TCGAATCACA 3720 

AAATCTCCGT TGTAATGTTT AGCATACAAG TAATTGAATA ATGCTGTTCT TGCATTACCA 3780 

ATATGAAGAT ACCCAGTTGG ACTTGGTGCA TATCTTACTC TTATACGATC GCTCATTTTT 3840 

TTCACTCCTA AATTAAATAT CAGATTTTCA AGTTAGTTCA TATAAATTGT TCATTTGCTA 3900 

TCTTCGACCG TCATAACAAA TGTCTAACTC GTCTTATTGT TAAAACGAAA CAATGCTTTT 3960 

TAACATGACC TTAAAATAAT TTCATTGTTT AATCATAACA TAATTCCCTG GGTAATATGC 4020 

TTAAATTTTA AATAGAAAGC TGTTGTTTTT TCAACACTTT AAAAAAGCTA TCCCTAAGAA 4080 
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TTAAACTTCA AATTAACTAT TCAAATACGT TAAAATTGAT TCTAATTTTG TATGTCTTGA 4200 

TTGCTATAAG AATAACTTTA TTAATATCTA . AAATTTAACA CTTAATGAAC TTGTTTCAAT 42 60 

GATATATTAG CACTATTTGT ATTTTTTGAT AACTAATATG TTTTGCATTT ATTTATAGTT 4320 

ATACTTCAAA TTACAAACTt CGCCATTTCA TATACCTTTT AATATCTATT TTGTTTTCGT 4380 

CAACTACAGT TTTTATAATG ATACTGTATC TTCGATTTTT TTAGCAAAAA CAATTCTTCC 444 0 

TGAAGATGTT TGCAATAAGC TGACTACTTC TAAATTGACA TGACTGCCAA TAAGATTTTT 4500 

AGCATTATCA ACAACTACCA TCGTACCATC ATCTAGATAT CCTACTGCCT GACCAGGCtC 4560 

CTTACCCATT TTTGTCAGTA AAATATGCAG TTGATCACCT TGATGTACAT TAGGTTTGAT 4620 

TGCTTCTGAT AAATCATTAA CATTTAATGC TTTGATACCA TGTACATGAC AAACTTTATT 4680 

TAGGTTGAAA TCTGTCGTTA TAATACTTGC ATGATATTGT TTTGCTAATT TTAATAACAT 4740 

20 CGTATCAATA TCACTATGTG TTTT A GTTGG ATGTATAACC TTTGTAGGAT AGTCTAAATC 4800 

ATACAATTCA TTTAAAATAT CTAAGCCTCT TTTACCCTTT TCaCGTTTAA CACTGTCATT 4 860 

TGAATCTGCA ACAATTTGTA ATTCATTAAT AACACCTTGT GGAATTAAAA TATTGCCATC 4920 

GATAAAACCG CAACGAATGA CTTCTAAAAT ACGACCATCA ATAATTGCGC TTGTGTCGAT 4 980 

AATTTTTGGC GTAgcaCTTT TaGTATGTTG TGACATGGAA CGCGCTATAT TCTCAGGTAA 5040 

AAACATTAAC ATTTCATCTC GTTTTTTAAG GCCAAATTGG AAACCGAAAT AACATAGTAA 5100 

TATCGTAATT ATGACAGGAA TGAAATGATT AAAAATAGAG TTGCCAATTG ATTCTAATAT 5160 

AAACGACACC ATAACAGAAA TAAGTAATCC GATTATTAAA CCTATTGTTG CGAATAGTAT 5220 

TTCAACAGCA CTTCTACGCA TAATAAAATG TTCTAAACCT TTTATAGCGT TAGTAACTCG 5280 

TCTAATAAAT ACACCAAAAA TTAAGAACAT AAAAATACTA CCGATAATGC CATCTACATA 5340 

GTGATTTTTT AAAAAGCTGG AGTTTTGTAA TCCAAGATCA TTTGCAATTT CAGGAATAAT 5400 

40 AATTATTCCT AATGCGCTCC CAATAATTAA GTAAATAATA ATAACCATTA GTTTAACGAT 54 60 

ATTCACACAA TGTCCTCCTT TCTTGATGTT TTATGAATGA AGAGCAAATG ACAATACTTC 5520 

ATGTACAGTA GTTACACCTA TTACTTGTAT ACCTTCAGGA TATGTCCATC CGCCTATATT 5580 

ATTTTTAGGA ATAATTACAC GTTTGAAACC TAGTTTTGCA GCCTCTTGCA CGCGTTGTTC 5640 

TATCCGAGAT ACACGACGTA CCTCACCCGT TAAACCAACT TCTCCAATAT AGCAATCTAA 5700 

TCCGTCGACA GCTTTATCTT TAAAGCTAGA TGCAGTTGCT ACAATTACAC TTAAATCAAC 5760 

TGCTGGCTCC GTTAACTTTA CACCGCCAGC TACTTTGATA TAAGCATCTT GTTGTTGTAA 5820 

TAGATAATTT TCTTTCTTTT CCAAAACAGC CATCAACAAA CTTAATCGAT TATGATCAAT 5880 
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TATTAAAAGT GGTCTGGTTC CCTCCATGGT TGCAACAATT GTTGAACCTG GAACATTTGT 6000 

TGAACGTTCT TCTAAAAACA TTTCAGATGG ATTATTTACA CCTTTTAATC CACTTTGCTT 6060 

CATTTCGAAG ATTCcCATTT CATTCGTTGA ACCAAAACGG TTTTTAACAG CTCGCAAAAT 6120 

TCGATATGCG TGGTGTTCAT CGCCTTCAAA ATAAAGCACA GTATCaACCA TGTGTTCTAG 6180 

CAATCTTGGG cCCAGCAATT TGACCTTCTT TCGTTACATG ACCCACTATA AAAGTTGCaA 624 0 

TGTTCATTTG TTTAGCAATA TTCATTAAAC TTTGTGTACT TTCACGAACT TGTGAAACAG 6300 

AACCTGGCGC AGAGCTGATT TCAGGATGAT ATATTGTTTG AATCGAATCC ACTACTAATA 6360 

15 AATCAGGTTG TTCTTCTTTT ACTGTTTGAT AAATAACTTC AAGATCTGTT TCAGCTAATA 6420 

CTTGCAATTC ACTTGAATCT TCATCTAATC GCTCTGCACG TAATTTAGTC TGACTAAGCG 64 80 

ATTCTTCTCC AGTAATATAT AGTACTTTTT TCTTTTGAGA TAACGATGCA CAAATTTGTA 6540 

20 AAAGTAACGT TGACTTACCA ATACCTGGAT CCCCACCAAT AAGTACTAAC GATCCGCTCA 6600 

CAATACCTCC ACCTAATACA CGGTTGAATT CTGCTGAATC TGTTAACACT CTCGGCGTTG 6660 

TTTCATGTTT AATACTATTT AATTTTTGTA CTTTACCTGC TAATTCCTTG GTTTTAACTC 6720 

CATGTTTAGG ATTGGCTGCT TTTTCAACAA TTTCCTCCAT TTGATTCCAA GCGCCACAAT 6780 

TAGGACATTT CCCCATCCAT TTAGGAGATT GATAACCACA AGCCATACAT TCAAAAATCA 6840 

CTTTTTTCTT GGCCArAATT GCAcCTCCAC TTTCTT 6876 

(2) INFORMATION FOR SEQ ID NO: 187: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1193 base pairs 
3S (B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

40 ' (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 187: 

CAACTCAAAC AGCAGAACAA CGTCGTGAGT TGATTAATGG TGTATTTACT GACATTAATC 60 

CCATACATTA AAAATATGAT GTACGTGTTA GCAGATAATA GACATATCTC ATTAATAGCT 120 

GACGTATTCA AGGCGTTCCA AAGCTTATAT AACGGACACT ACAATCAAGA TTTTGCAACA 180 

ATTGAGTCAA CATATGAATT GAGTCAAGAA GAGTTAGATA AGATTGTCAA ACTAGTAACT 240 

CAACAAACGA AGTTATCTAA AGTTATTGTA GATACAAAAA TTAATCCAGA TTTAATTGGT 300 

GGATTTAGAG TTAAAGTCGG CACAACTGTA TTAGATGGTA GTGTTAGAAA TGATCTTGTC 360 

CAATTACAAA GAAAATTTAG AAGAGTTAAT TAATTATAAA GAGGAGTGAC ATAGATGGCC 420 
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ATGTCCGTAA CTGATGTAGG TACTGTATTA CAAATTGGTG ATGGTATTGC ATTAATTCAC 540 

GGATTAAATG ACGTTATGGC TGGTGAGCTA GTAGAATTCC ATAACGGCGT ACTTGGTTTA 600 

5 

GCCCAAAACC TTGAAGAGTC AAACGTGGGT GTGGTTATTT TAGGACCATA CACAGGTATT 660 

ACTGAAGGTG ACGAAGTTAA ACGTACTGGT CGTATCATGG AAGTACCAGT AGGTGAAGAA 720 

CTAATCGGAA GAGTTGTTAA TCCATTAGGA CAACCTATTG ATGGAcAAGG ACCGATTAAC 780 

10 

ACAACTAAAA CACGTCCaGT AGAGAAAAAA GCTACTGGTG TAATGGATCg TAAATCAGTA 840 

GATGAGCCAT TACAAACAGG TATCaAAGCA ATTGATGCTT TAGTACCAAT TGGTAGAGGT 900 

15 CAACGTGAGT TAATCATCGG TGACCGTCAA ACAGGTAAAA CAACAATTGC AATTGACACA 960 

ATTTTGAACC AAAAAGATCA AGGTACGATT TGTATCTATG TTGCTATTGG TCAAAAAGAT 1020 

TCAACAGTAA GAGCAAATGT TGAAAAGTTA AGACAAGCAG GCGCTTTAGA CTACACTATT 1080 

on 

GTTGTAGCAG CATCAGCTTC TGAACCTTCT CCATTATTAT ATATTGCACC ATATTCAGGT 1140 
GTAACAATGG GTGAAGAATT CATGTTTAAC GGTAAACATG TTTTAATCGT TTA 1193 
(2) INFORMATION FOR SEQ ID NO: 188: 

25 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5549 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

30 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 188: 

35 TGCTAAGAAG TCAAAATAAA CTAACTATnA AACATCTAGT ACGATTATTA AAGTGACAGA 60 

TnATAAAATT GAATTATTnA GAGAAGGAGA TATAAAGTTT GAAGAAATAA AAGAAAGACT 120 

AGGTACAGGT ATTATTTATG AATAAGTTAA TACTTGGGAT TTATTTATAC CGAATTTTTT 180 

40 CACGAGCATA CTTTTATTTA CCGTTTTTAT TAATTTACTT TTTGATTCAA GGTTATTCCA 240 

TAATACAATT AGAAATATTA ATGGCGTCTT ATGGCATTGC AGCATTTTTA TTCTCTCTAT 300 

ACAAAGAGAA GTGTTTTAAA ATTTGTAACT TAAAAGATTC TAATAAATTA GTTGTTAGTG 360 

45 

AAATATTCAA AATCATCGGT TTATTGTTGT TATTATATCA AAATCAATAT TTAATTTTAG ,420 

TAGTGGCACA AATATTATTA GGGTTAAGTT ACTCAATGAT GGCGGGTGTT GATACCGCAA 480 

TAATTAAAAG AAATATAACA AATGAGAAAT ACGTACAAAA TAAGTCAAAT AGCTATATGT 540 

50 

TCCTATCATT ATTAATTTCA GGGATTATAG GTAGTTATCT TTATGGAATA AATATTAAAT 600 

GGCCTATAAT AATGACTGGT ATATTTTCAA TTCTAACAAT TATAATTATT CGATGCACAT 660 

55 



877 



EP 0 786 519 A2 



10 



15 



TACCAGAAGA GAAGTTTTGG ATATTGCATT ATTCTTTTTT AAGAGCGTTA ATATTAGGAT 780 

TTTTTATAGG ATTTATTCCA ATTAATATAT ATAATGATTT AAAACTGAAT AATTTACAAT 840 

TTATTTCAGT ATTAACTTGT TACACAGTTA TGGGTTTTGT ATCTTCACGT TATTTAACTA 900 

AATACTTGAA TTATAAGTTT GTGTCAGAAA TTTGTTTAGT AATATTTTTA ATAATATATA 960 

CATATCAAAG TTTCATAGCA GTTACTATTT CTATGATATT TTTAGGTATT TCTTCAGGGT 1020 

TAACTCGTCC ACAAACTATA AATAAACTTT CTAGCAGTAG TAACTTAAGA GTGATGCTTA 1080 

ATTATGCAGA AACGTTATAT TTTATTTTTA ATATCGCATT TTTACTTATG GGTGGTTACT 1140 

TATATACAAT AGGAACTATT CAATACTTAA TATTATTTAT TTCGTTATTA ATTTTTATAT 1200 

ATTTAATAAT AATATTTyAT TTTACAAGGA GAGAGCAACA TGAAAATAAA AACTGAATTT 1260 

AAAGGGAACA ATATACCATA TGAATACGCA GCAGGTGCAG ATGTGAGTGA TTCTATTAAC 1320 

20 GGGAATCCAA TTAAGTCATT TCCATTTGAA GTAATTGAAT TACCGGAAGG gACTAAATAT 1380 

CTTGCTTGGT CTTTAATTGA CTATGATGCA ATTCCTGTAT GTGGCTTTGC TTGGATTCAT 1440 

TGGAGTGTAG CTAATGTAAG TGTTAGTGGC AATTCAATTT CTATAAAAGC AGATTTATCA 1500 

AGAACAAAGG GCGACTATGT ACAAGGTAAA AATAGCTTTA CTAGTGGGTT GTTGGCTGAA 1560 

GATTTTTCAG AAATAGAAAA TCACTATGTA GGACCTACAC CACCTGATCA AGATCATCAA 1620 

TATGAATTAA CAGTTTATGC GTTAGATCAT TCTTTAAATT TGAAGAATGG GTTCTACTTG 1680 

AATGAATTTT TAAAAGAAGT AAATCAACAT AAAATTGATC AAACAAGTAT TAACCTTATA 1740 

GGAAGAAAAA TTTAATACTA AATATCTCAT CAATATAAAA TTGTTCAATT AAAAGTACAA 1800 

AGAAACAAAG GTTTTAATTT ATATATTAGG TACGGCGTTC GCTATAATGC AAAGAAGTAA I860 

TTAAATTTAA GAAATGTAAA CTTAGTTATT GTAATGTGAA TTTATTTGAA AAAATAGAAA 1920 

GTATXAACAA TTATAGCTTT TACATTAATT AAAATTTATT TTTAAAAACA AGTAAACAAT 1980 

40 TTACATACTT ATAATTTTTG AAAATTTTCA ATTTGTGTTA TATTGATTTT GTAAGATACT 2040 

TTAACTCACA AAGGAGAGAG AGTATATGAA ATTAAAATCA TTTATAACTG TAACTTTGGC 2100 

ACTGGGCATG ATCGCAACGA CTGGCGCTAC TGTGGCAGGT AATGAGGTAT CTGCAGCAGA 2160 

AAAGGACAAA CTACCGGCAA CTCAAAAAGC TAAAGAAATG CAAAATGTTC CATATACAAT 2220 

TGCAGTAGAT GGCATTATGG CTTTCAATCA ATCTTACTTA AATTTACCAA AAGATAGCCA 2280 

ATTATCATAT TTAGATTTAG GAAATAAAGT TAAAGCTTTG TTATATGATG AACGCGGTGT 2340 

AACACCTGAG AAGATTCGAA ATGCAAAATC TGCCGTTTAC ACGATTACTT GGAAAGATGG 2400 

TAGTAAAAAA GAAGTGGATC TTAAGAAAGA TAGCTACACA GCAAACTTGT TTGATTCAAA 2460 
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CAACATGAAG CATTTAATTT TACAGTGATG 
TACTCGTAAA TGACATCTTT GTATTAAGGC 
5 GGTCATTGAG CTTTAAAATA TTCAAAATAC 

CTTTATCTGG GCAGCTTCAA TAATAAGAAA 
TGTGATGAAT CTTTCGGCGG TTTAATTACT 

10 

AATACTGCCA TGATAATTGG ATTCACTACA 
AGTACAAAGT TAACCATTTG CATTAATAAT 

15 ATGTCATTCT ACCTCCACTT TAATTATATA 

GTATAGTAAC ATCTCATATA TTTTGACCAT 
GAATGGCTAT TCTAAATTAA GCGCATTAAA 

20 AAAGCATTAA AATTTTATTA ACTAGTCAAT 

AATCTATGTT AAATTAATAC CTGGTATTAA 
ACGTGGGTAT TAAAGGTTTT GGTGCATATG 

25 TTGAGCAATT TTTAGATACA TCTGATGAAT 

GACATTGGGC AGATGATGAT CAAGATACTT 
CAATCGCTGA CGCTGGTATT CAGCCCGAAG 

30 

CTGGaGATAT GCCATTTCCA ACTGTCGCAA 
AAGTTGCCTC TATGGATCAA CTTGCAGCAT 
CTAAACAATA TGTTCAATCT GGAGATTATC 

35 

TATCTAAAAT AACAGATTTA ACTGACCGTT 
GTGCGGTTAT CATCGGTGAA GTTTCAGATG 

40 CTGATGGCAC AGGTGGTAAA CATTTATATT 

ATGGTCGAGA AGTATTTAAA TTTGCTGTTA 
TTGAAAAAGC GAATTTAACA TCAGATGATA 

45 TTAGAATTAT GGAATCAGCT AGAGAACGCT 

CTGTAAATAA ATATGGAAAT ACTTCAGCTG 
TAAAAAATGG TAAAATCAAA GATGATGATA 

50 

TAACTTGGGG CGCAATGACA ATAAAATGGG 
TAAAAGAGTA GTTATTACAG GTATGGGAGC 

55 



ATTATAAAAT AATTGCCTTG ATACAAAGAT 2580 

TTTTTCTAAA TTTAAAAGTG ATGGGTTAGA 264 0 

AAAACATTAA TGGCCAAAAA TAAAAGCCGC 2700 

GACATATTTC ATTTTATACT AAATAGTTAT 2760 

GCAGCAAAAA TTGCTGTGAA AATCGTGAAC 2820 

TTTAAGCTGT CTCCACCTAC TAGGCTATTA 2880 

AATGCCCAAA AGAATGTTAC GAGGTGTTTC 2940 

TATTTTATTT TAAGTGAAAG TTAGAAATTT 3000 

ATTATACAGT TTAAATAAAT GATTTTATCT 3060 

ACCAATTTCA TACTGAAATT TGACGATAAT 3120 

ATTCCTACCT CTGACTTGAG TTTAAAAAGT 31B0 

AAATTTTATT AAGAAGGTGT TCAACTATGA 3240 

CGCCAGAAAA GATTATTGAC AATGCCTATT 3300 

GGATTTCTAA GATGACTGGA ATTAAAGAAA 3360 

CAGATTTAGC ATATGAAGCA AGTTTAAAAG 3420 

ATATAGATAT GATAATTGTT GCCACAGCAa 3480 

ATATGTTGCA AGAACGTTTA GGGACGGGCA 354 0 

GTTCTGGATT TATGTATTCA ATGATTACAG 3600 

ATAACATTTT AGTTGTCGGT GCAGATAAAT 3660 

CTACTGCAGT TCTATTTGGA GATGGTGCAG 3720 

GCAGAGGTAT TATAAGTTAT GAAATGGGTT 3780 

TAGATAAAGA TACTGGTAAA CTGAAAATGA 3840 

GAATTATGGG TGATGCATCA ACACGTGTAG 3900 

TAGATTTATT TATTCCTCAT CAAGCTAATA 3960 

TAGGTATTTC AAAAGACAAA ATGAGTGTTT 4020 

CGTCAATACC TTTAAGTATC GATCAAGAAT 4080 

CAATTGTTCT TGTCGGATTC GGTGGCGGCC 4140 

GAAAATAGGA GGATAACGAA TGAGTCAAAA 4200 

CCTTTCTCCA ATCGGTAATG ATGTCAAAAC 4260 
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TGAACCTTAT 


AGCGTTCACT 


TAGCAGGAGA 


ACTTAAAAAC 


TTTAATATTG 


AAGATCATAT 


4380 


CGACAAAAAA 


GAAGCGCGTC 


GTATGGATAG 


ATTTACTCAA 


TATGCAATTG 


TAGCAGCTAG 


4440 


AGAGGCTGTT 


AAAGATGCGC 


AATTAGATAT 


CAATGAAAAT 


ACTGCAGATC 


GAATCGGTGT 


4500 


ATGGATTGGT 


TCTGGTATCG 


GTGGTATGGA AACATTTGAA ATTGCACATA AACAATTAAT 


4560 


GGATAAAGGC 


CCAAGACGTG 


TGAGTCCATT 


TTTCGTACCA 


ATGTTAATTC 


CTGATATGGC 


4620 


AACTGGGCAA 


GTATCAATTG 


ACTTAGGTGC AAAAGGACCA AATGGTGCAA 


CAGTTACAGC 


4680 


ATGTGCAACA 


GGTACAAATT 


CAATCGGAGA 


AGCATTTAAA 


ATTGTGCAAC 


GCGGTGATGC 


4740 


AGATGCAATG 


ATTACTGGTG 


GTACAGAAGC 


ACCAATTACT 


CATATGGCAA 


TTGCTGGTTT 


4800 


CAGTGCAAGT 


CGAGCGCTTT 


CTACAAATGA 


TGACATTGAA 


ACAGCATGTC 


GTCCATTCCA 


4860 


AGAAGGTAGA 


GATGGTTTTG 


TTATGGGTGA 


AGGTGCTGGT 


ATTTTAGTAA 


TTGAATCTTT 


4920 


AGAATCAGCA 


CAAGCTCGAG 


GTGCCAATAT 


TTATGCTGAG 


ATAGTTGGCT 


ATGGTACTAC 


4930 


AGGTGATGCT 


TATCATATTA 


CAGCGCCAGC 


TCCAGAAGGT 


GAAGGTGGTT 


CTAGAGCAAT 


5040 


GCAAGCAGCT 


ATGGATGATG 


CTGGTATTGA 


ACCTAAAGAT 


GTACAATACT 


TAAATGCCCA 


5100 


TGGTACAAGT 


ACTCCTGTTG 


GTGACTTAAA 


TGAAGTTAAA 


GCTATTAAAA 


ATACATTTGG 


5160 


TGAAGCAGCT 


AAACACTTAA 


AAGTTAGCTC 


AACAAAATCA 


ATGACTGGTC 


ACTTACTTGG 


5220 


TGCAACAGGT 


GGAATTGAAG 


CAATCTTCTC 


AGCGCTTTCA 


ATTAAAGACT 


CTAAAGTCGC 


5280 


ACCGACAATT 


CATGCGGTAA 


CACCAGATCC 


AGAATGTGAT 


TTGGATATTG 


TTCCAAATGA 


5340 


AGCGCAAGAC 


CTTGATATTA 


CTTATGCAAT 


GAGTAATAGC 


TTAGGATTCG 


GTGGACATAA 


5400 


CGCAGTATTA 


GTATTCAAGA 


AATTTGAAGC 


ATAACTATAA 


nAATCTTCAG 


TAACGTTGTT 


5460 


TTAGTTACTG 


AAGATTTTTT 


CaGTTTCTTT 


ATACTAAGAT 


GAGCGACAcA 


CAATCGTCAT 


5520 


AATAAAATAT 


GAATATTTAT 


TAATAATAA 








5549 



40 (2) INFORMATION FOR SEQ ID NO: 189: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4832 base pairs 

(B) TYPE: nucleic acid 
45 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 189: 

50 

AGATTATAGT AAGATTGATA GTTTGGCGAC TGaAGCgCGa GaAAAATTAT CAGaAGTAAA 60 
mCCTTTAAAT ATTGCACAAG CTTCTAGAAT ATCAGGGGTA AATCCAGCAG ACATATCTAT 120 

55 
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TGGTTAGCAG AACAATTAAA AGAACATAAT ATTCAATTAA CTGAGACTCA AAAACAACAG 240 

TTTCAAACAT ATTATCGTTT ACTTGTTGAA TGGAATGAAA AGATGAATTT GACAAGTATT 300 

ACAGATGAAC ACGATGTATA TTTGAAACAT TTTTATGATT CCATTGCACC TAGTTTTTAT 360 

TTTGATTTTA ATCAGCCTAT AAGTATATGT GATGTAGGCG CTGGAGCTGG TTTTCCAAGT 420 

ATTCCGTTAA AAATAATGTT TCCGCAGTTA AAAGTGACGA TTGTTGATTC ATTAAATAAG 480 

CGTATTCAAT TTTTAAACCA TTTAGCGTCA GAATTACAAT TACAGGATGT CAGCTTTATA 540 

CACGATAGAG CAGAAACATT TGGTAAGGGT GTCTACAGGG AGTCTTATGA TGTTGTTACT 600 

75 GCAAGAGCAg TAGCTAGATT ATCCGTGTTA AGTGAATTGT GTTTACCGCT AGTTAAAAAA 660 

GGTGGACAGT TTGTTGCATT AAAATCTTCA AAAGGTGAAG AAGAATTAGA AGAAGCAAAA 720 

TTTGCAATTA GTGTGTTAGG TGGTAATGTT ACAGAAACAC ATACCTTTGA ATTGCCAGAA 780 

20 GATGCTGGAG AGCGCCAGAT GTTCATTATT GATAAAAAAA GACAGACGCC GAAAAAGTAT B40 
CCAAGAAAAC CAGGGACGCC TAATAAGACT CCTTTACTTG AAAAATAATG CATAATCCTT < 900 

TACAACTAAC ATAAAAGGAG CGAATGGATA ATGAAAAAAC CTTTTTCAAA ATTATTTGGT 960 

TTGAAAAACA AAGATGACAT CATTGGACAT ATTGAAGAAG ATCGCAATAG TAATGTTGAA 1020 

TCCATTCAAA TTGAACGTAT CGTTCCCAAC CGTTATCAAC CAAGACAGGT GTTTGAACCA 1080 

AATAAAATTA AAGAACTTGC TGAATCAATA CATGAACATG GTTTACTACA ACCTATTGTT 1140 

GTAAGACCGA TTGAAGAAGA TATGTTTGAA ATTATTGCTG GAGAGCGCCG ATTTAGAGCA 1200 

ATACAATCAC TAAATTTACC TCAAGCAGAC GTTATTATTC GTGATATGGA TGATGAAGAG 1260 

ACGGCTGTTG TTGCATTAAT TGAGAATATT CAAAGAGAAA ATTTGTCTGT TGTTGAAGAA 1320 

GCGGAAGCCT ATAAGAAATT ATTGGAAATT GGTGATACAA CGCAAAGTGA ATTGGCAAAA 1380 

AGTT^AGGTA AAAGTCAAAG CTTTATTGCA AATAAGTTGC GTTTATTGAA GTTGGCGCCG 1440 

40 AAAGTACTAC TTCGCTTAAG AGAAGGTAAA ATTACTGAAC GTCATGCGAG AgcGGtATTA 1500 

TCATTGTCTG ATAGCGAACA AGAAGCGTTG ATTGAGCAAG TCATTGCACA AAAGCTAAAT 1560 

GTGAAcAGAc TGAAGATAGA GTACGCCAAA AAACGGGGCC CGAAAAAGTC AAAGCACAAA 1620 

ACCTTCGCTT TGCACAAGAT GTCACTCAAG CACGAGATGA GGTAGGCAAA AGTATCCAAG 1680 

CGATTCAACA AACAGGATTA CATGTTGAGC ATAAAGACAA AGATCATGAA GATTATTATG 1740 

AAATAAAAAT TCGAATATAT AAACGTTaGT AGTAGGATGT CGTATACATG ATGACTAACA 1800 

CATAAAAGAC AAAGCTAAGA TCATAACAGC TTTGTCTTTT TTTTTTGTTT TACGTGAAAC 1860 

ATAAAAATTT ATATTTATAT GTTGATCAGG CTGGTACATA AATCAATGTT CTATGCTCTA 1920 
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TTCT AG T CAA 


CCTTGCTGGG 


GTGGGACGAC 


GAAATAAATT 


TTGCGAAAAT 


ATCATTTCTG 


2040 




TAATTTGAGC 


TGGATATACT 


TTCATTTGAA 


CCCTTTATTG 


CTAGTTTATG 


2100 




CjAAAGCTTTA 


TGAACATCGC 


TTGAGTTGCC 


TTTACAGTAG 


AAAATTTAAG 


2160 


TTTTACACTT 


TGTGTGAATG 


ATACGTTTTG 


TATTGAATTA 


ATTATAGAAA 


GGTACGTTGA 


2220 


AGATGTTTTC 


AATTGGAAGT 


GCAATTCTTC 


ATTTTGTCAT 


TGGTGGTATC 


GCTGTTGCAT 


2280 


TAG CTT CAAT 


TATTGCTGAT 


AAGGTAGGTG 


GTAAGTTAGG 


AGGTATTATA 


GCTACTATGC 


2340 


CGGCAGTCTT 


TCTTGCGGCT 


ATTATCGCAT 


TAGCTTTAGA 


TCATCGTGGT 


ACGCAATTAG 


2400 


TGGAGATGTC 


GATGAATCTT 


AGTACTGGAG 


CAATTGTCGG 


TATTCTGTCT 


TGTATATTAA 


2460 


CTGTATTTTT 


GACATCTCTC 


TACATTAAGC 


ATAAAGGTTA 


TCGGAAAGGC 


GCAATATTCA 


2520 


CAGTTGTTTG 


TTGGTTTGTC 


ATTTCCCTCG 


CAATATTCAG 


TATTAGACAT 


TTATAGTTTG 


2580 


GAAAATGCGT 


GATAATTAGT 


TGTATTCAGT 


TATTAAGTAA 


TAAATTATTG 


GAGGCAGAAC 


2640 


ATCATGAAAT 


TAACATTAAT 


GAAATTTTTT 


GTGGGGGGAT 


TTGCAGTATT 


ATTAAGTTAT 


2700 


ATTGTATCTG 


TAACACTACC 


TTGGAAAGAA 


TTTGGCGGTA 


TATTTGCaAC 


GTTTCCGGCA 


2760 


GTATTTTTAG 


TGTCTATGTT 


TATTACAGGT 


ATGCAATATG 


GTGATAAAGT 


CGCTGTGCAT 


2820 


GTAAGTCGTG 


GCGCAGTGTT 


TGGTATGACA 


GGGGTATTAG 


TTTGTATTTT 


AGTTACATGG 


2880 


ATGATGTTAC 


ATATGACGCA 


CATGTGGTTG 


ATTAGCATTG 


TTGTTGGTTT 


CCTAAGCTGG 


2940 


TTCATCAGTG 


CAGTATGTAT 


TTTTGAAGCG 


GTAGAATTTA 


TAGCACAAAA 


AAGATTAGAA 


3000 


AAG CAT AGTT 


GGAAAGCTGG 


AAAATCGAAT 


AGTAAATAGT 


GTGAACGTAA 


TCTCTTAACT 


3060 


AGGACTAACT 


TTG CAAG CAT 


TGAATAGCAT 


GG AAAAGTTG 


CATCATTAAT 


AAGTGAAATT 


3120 


CAAGTTGGCA 


TTGAGAAAAT 


TACAAGCGCG 


TAATCATACa 


GGTCTGTCTT 


AAGGGAGTCT 


3180 


TCGAACCCCG 


ATGTTGTCGT 


ATGTCAAAAC 


ATTTAGTCAA 


TCATAAAGGT 


GACTTGATTT 


3240 


AACTTTATCT 


GATAGTCTGA 


TTGTAATGAT 


TGTACTAATT 


GACTGGAGGC 


GTATGTAATT 


3300 


GAATCTGAGT 


AAACAAATTA 


AAAAGTATAG 


GGAACGAGAT 


GGTTATTCAC 


AAGAATATCT 


3360 


TGCTGAAAAG TTATATGTAT 


CTAGGCAGAG 


TATTTCTAAT 


TGGGAAAATG 


ACAAAAGCTT 


3420 


ACCAGACATA CATAACTTAT TAATGAyGTG TGAATTGTTC AATGTAACTT TAGATGATTT 


3480 


AGTAAAAGGG 


ACCATTCCAT 


TTGTACCTGA 


TATTAAAGCG 


CAACGAAGTC 


TTAACTTATG 


3540 


GACATATGTG 


ATGCTTATTT 


TCATGACATT 


AGCTGCAATT 


TTAATGGGAC 


CTTTAGTTGT 


3600 


TTATTGGAAT 


TGGACTTGGG 


GTGTAACGGT 


GGCAATCATT 


TTGGGAATAG 


GTTTTTATGC 


3660 


ATCTATGAAA 


ATAGAAGATT 


TAAAAAAAGT 


GCATAAAATG 


GACAACTACG ATCGAATTGT 


3720 
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GACAAATGCG 


CTTTCTATTA 


TATCAGTAAT 


TGGTATACTC 


AGCCTCATAA 


TTTTCCTTAG 


TGTGTATTTG 


GCAAATAAGT 


TTTTATAAAT 


CATCGTGGTA 


TCGTCTCATA 


TTATTTATAT 


TATCCAAAAT 


AGCATAAAAA 


AATACCAACA 


AGATTTAGAA 


CCTTGTTGGT 


AATCAAAGCG 


aTTCATTTAT 


AATGAGTCGT 


TTTATGTTGT 


AAGATTAAAC 


AGTTTGTACG 


TTAACTGCTT 


GGTCTCCACG 


TTGACCTTCA 


GTGATTTCGA 


AAGTAACTTT 


TTGACCTTCT 


TCTAAAGTTT 


TGTAGCCATC 


GCTAGCGATA 


CCTGAGAAAT 


GTACGAATAC 


GTCTCCGCCA 


TTTTCTTGTT 


CGATGAAACC 


AAAACCTTTT 


TCTGCrTTAA 


ACCATTTwAC 


TGTACCGTTA 


TTCATATwGA 


AwACCTCCGT 


gTGCTTTTGC 


ACTTAATATT 


TGTAACAAAT 


TCATAACTAA 


AAAAGAGGAT 


ATTCTAAACA 


AATACACTAC 


AATTTAATTC 


ACGAGCTTTT 


ATTACGTAAG 


ACCAACTATA 


CGCTCATATT 


GGCATAATGT 


ACAGTGTTTT 


TTGAAAATAA 


ATTAAAAAAG 


ATTTTTAAAA 


ACCTTAGAAA 


CGTTGATTTA 


AAGGGGTTTA 


TAAAAATwAw 


AAAATTGTAG 


TCTTTTATGG 


TGTTTGCTAG 


TTTTCAAAGT 


GACATATCGT 


TTAAACATGA 


TGATTTTATA 


AGCAATCCAT 


AAAAAACAAG 


CAGCGATAAA 


CGCTACTTGT 


TGATATTAAA 


ATCTGACTTG 


AAAGGTCATA 


GCAATGTTCT 


ATACCGATGG 


AATGTGCTTA 


CTTGCCTTTT 


TCTTCACGAC 


GTTTTAAATA 


ATAAGAGCCA 


CCTAATAAAC 


CAGCTGGAAT 


GCCTATCATT 


GGTGTTGTGA 


ATGAGCTTAA 


TACAATAACA 


AGTATTGTTA 


AAGCAATGAC 


GTTATACCAA 


GTTACAGTCA 


AATTTTTCAA 


ATCCTCATAT 


GATTGTTTTA 


CTAATTCTCT 


AAATTTCATG 


ATTCAATCTC 


TCCTTTTTTA 


TAAATCTTTA 


GATTGTCAAA 


TTAAGCTGGA 


CA 







(2) INFORMATION FOR SEQ ID NO: 190: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5727 base pairs • 
r (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 190: 
CAAAGCTGTT CAAAAGGCTT ATAATTTAAA TTTAGATAAC ATACGTACAA TGGAACCTAA 
GTTGAGATAT CAAGCGATCA ATAAAGGTAA TATTAATTTA ATAGATGCAT ATTCAACTGA 
CGCTGAATTA AAACAATATG ATATGGTTGT GTTAAAAGAT GATAAGCACG TATTTCCACC 
ATATCAAGGA GCACCATTAT TTAAAGAAAG CTTTTTAAAG AAACATCCAG AAATTAAGAA 
ACCGTTAAAC AAACTAGAAA ACAAAATATC TGATGAAGAT ATGCAAATGA TGAACTATAA 
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15 



GTTAATCAAA TAACGACCAA CGCCACATAA GATGCGTAAC ACCAAATTAT ATCTTATGTG 4 20 

GCGTTGTTAT ATTTAAATCT ATAATTATGT TCAATTTAAA CATGCAATAA TGATTAAAAA 4 80 

ATATGACATG TTAAACACAA TGTAAGCTAT TATGATGTGA AAATAGTAGC ATTGCATTTT 54 0 

AGAAACATAG AGCGATATAA TGAATATAAG TTTTTTGAAA TTTCAGTTAA TTCTAAGGAG 600 
GTTGTTTTTA TTATGAAAGA ACAACTTAAT CAACTATCAG CATATCAGCC TGGTTTATCT 660 
CCAAGGgCAT TGAAAGAAAA GTATGGCATT GAAGGAGATT TATATAAACT TGCATCAAAT 720 
GAAAATTTGT ATGGACCATC GCCTAAAGTT AAAGAAGCGA TATCAGCACA CTTAGATGAG 780 
TTATATTATT ATCCTGAAAC AGGATCACCG ACATTAAAAG CGGCGATTAG TAAACATTTA 84 0 

AATGTAGATC AATCACGCAT TTTATTTGGT GCGGGATTAG ATGAAGTTAT ATTAATGATT 900 
TCTAGAGCTG TATTAACGCC AGGGGATACT ATTGTTACAA GTGAAGCGAC ATTCGGTCAA 960 

20 TATTATCACA ATGCGATTGT TGAATCAGCT AATGTGATAC AAGTACCTTT AAAAGATGGT 1020 

GGCTTCGATT TAGAAGGTAT TTTAAAAGAA GTTAATGAAG ATACGTCATT GGTATGGTTA 1080 

TGTAATCCAA ATAATCCTAC AGGTACATAT TTTAATCATG AGAGCTTAGA TTCGTTTTTA 114 0 

25 TCTCAAGTAC CTCCACATGT ACCAGTAATT ATAGATGAAG CTTATTTTGA ATTTGTGACA 1200 

GCAGAGGACT ACCCGGATAC ACTTGCTTTG CAACAAAAAT ATGACAATGC TTTCTTATTA 1260 

CGTACATTTT CAAAGGCGTA TGGATTAGCG GGTTTACGTG TAGGATATGT GGT AG CAAGT 13 20 

GAACATGCGA TTGAAAAATG GAACATCATT AGACCACCAT TTAATGTGAC ACGTATATCT 1380 
GAATACGCAG CAGTTGCAGC ACTTGAAGAT CAACAATATT TAAAAGAGGT AACACATAAA . 1440 

AATAGTGTTG AACGCGAAAG ATTTTATCAA TTACCTCAAA GTGAGTATTT CTTGC CAAGT 1500 

CAAACGAATT TTATATTTGT AAAAACmAAG CGGGTAAATG AACTTTATGA AGCACTTTTA 1560 

AATGTAGGGT GTATTACGCG ACCATTTCCA ACTGGTGTTA GAATTACAAT TGGTTTTAAA 1620 

GAACAAAATG ATAAAATGTT AGAAGTTTTA TCAAACTTTA AATACGAATA GTAAGTGGGG 1660 

AGTGGGACAG AAATGATATT TTCGCAAAAT TTATTTCGtC GTCCCACCCC AACTTGcATT 1740 

GTCTGTAGAA ATTGGGAATC CAATTTCtCT TTGTTGGGGC CCCGCCGGCA AGGTTGACTA 1800 

45 GAATTGAAAA AAGCTTGTTA CAAGCGCATT TTCGTTCAGT CAACTACTGC CAATATAACT 1860 

TTGTAGAGCA TTGAACATTG ATTTATGTCT CAAGCTCAAT GCAGTGTGAA TGATGAGGTG 1920 

AGAGTATTCA GTGTAAAAAG CAACAATAGA TGATATTGTT TTGTATCAAT TGCTTTTTTG 1980 

50 CTATACTGAA TCAATACTGA TATTTTCAGG AGAAGATTAA AATGACCCGT AAATCAATCG 2040 

CGATTGATAT GGATGAAGTA TTGGCAGATA CATTAGGAGA AATCATTGAT GCTGTCAATT 2100 
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TTCCTGAACA 
TTAAAGTGAT 
ATATTGCTAC 
TAGAGTTCTT 
TTAAAGCTGA 
CGATTATGTT 
GGAAAGATGT 
AATTTCATGT 
TATGTCTTAG 
GAAATTGGAT 
ATACTTTTTC 
TTTAAGTACA 
GTTCTTTATC 
GGATGAATGT 
AAGACGCATA 
AAATTATATG 
GGTGCGTTGA 
CGGATGCTTA 
CAATAGGTGT 
TAAGTGAAAT 
TGCTATCACG 
AAGTGTTCAG 
TGAATGGACC 
TTGATAATTG 
AACTCAATTT 
TGAGACCTAA 
TACCAACTTG 
GCGTTTTTGT 
CATGTGTCAT 



TGATGGATTA 
GCCGTATGCA 
AGCAGCAATG 
TCCATTTTTA 
TTATTTAATA 
TACAGCAGTG 
AGAACAGTAT 
AGAAAAGATG 
ACACTACAAC 
TCCCAATTTC 
TTTAGAAATT 
CATTAGCTGT 
ATTTCCGTCC 
GTTAATCTAT 
AACCACTATG 
TCTGTTTTTG 
ATCTTATGAT 
CAAATCATTG 
TTCTAATGAA 
CTTTTTACCA 
CTTTTTAAAA 
TTCACCATCT 
ATTTGCTGTT 
ATAATTAAAT 
ACCAAATATA 
GCCAACAAAG 
TGCAGAAATC 
AAAATCATTA 
AACACCGTTT 



ATTACAGAAG 
CAAGAAGTTG 
GATGTACCAA 
GATCCTCAGC 
GATGACAATC 
CATAATATTA 
TTTTTAGATA 
ATGGATAGGC 
ACTATATTGG 
TACAGACAAT 
AGTATTTCTT 
GACTAATGAT 
CGCTCTCAAT 
GGCAGATTAC 
ATTTAAAATA 
AAACAGGGTA 
TACACTCCAA 
ACAGTAAGTA 
ATTTCGCCAT 
GGTATATGCT 
ATATCATTTA 
TGAGGAGACA 
AGTATCATGG 
TGTGTTGGAT 
TCTTTTGAAC 
TTGAGTGCAT 
ATTTGTTCAC 
AAAGTACCGC 
ATAAGTTCGT 



TATTGAGAGA 
TGAAAAAATT 
CATCATTTAG 
ATTTTGTTTT 
CTAGACAGCT 
ATGATGATCG 
ATATTGAGAA 
TATAAAGTAA 
CAGTAGTTGA 
GCAAGTTGGG 
ATGCATGAGT 
AAAGAATCGC 
AAATGTTAGT 
ACGTCATCCG 
CAACATCAAT 
ATAGCTTAAA 
ACCTAATATA 
ACTGAATGGC 
CAATATCAAC 
CAATACCTTG 
AAATACTGAA 
AATCAGTCaA 
TCGTTTCGCC 
TTAGCAGTGT 
CATCTTGTAC 
ATTGATTATT 
TAGCTTGTTT 
CTGGTAAAAT 
TAACCGTGCC 



ACCAGGCTTC 
AACTGAACAT 
TGATAAATAT 
TTGTGGTAGA 
TGAAATTTTT 
ATTTGAACGC 
ATAAAATATA 
TTGTGACTGA 
CTGCGGGGCC 
GTGGsCCCCA 
GTAACTCATG 
TACATAATCA 
CTATCTTATT 
ATTTTTTATA 
CATTTTAGTG 
GCTAATAAAA 
ATATCGGGTT 
ATTTGGTATA 
TTTCATTGCT 
AGTAATTTCA 
ACTTTGTTCA 
TGGTATACGA 
AGAATATGTC 
TTTGACAGTT 
GTTTTCAGCG 
TATTTTAATT 
ATGATTAGGT 
GCCAATAGGG 
ATCACCGCCA 



TTCAGACATC 
TATGATGTAT 
GAATGGTTAC 
AAAAACATCG 
ACTGGTACAC 
GTAAATAGCT 
TCACTTGAAA 
GATGAACTTT 
CCAACATAGA 
ACATAAAGAA 
CATTCATATT 
ATCATTAGTC 
ATTATAAATC 
GAATTTGAAA 
gCATGCGCCA 
ACGAATATAA 
AAGATCATTC 
ACCTCAATAT 
GGATCTGTTG 
TTCCaATTCA 
TTAAAAATGA 
CTACCACCAA 
TTATCATCTA 
GATCCAATAT 
TTTTGAACAA 
ACATCGTATG 
GCTATATTTA 
AGTTGAAGGT 
AGAATAAATA 
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CACCTTCGTT 


TTCACTCAAT TGAATAGAAA GATGCTTACA AATTGAACTT AATGCTGTTG 


4020 




TAACTTCCCC 


AATACCTTGA 


TTAATATTTT 


TTAATCCACT 


GTGTTCATGG 


TAAAAGAGGA 


4080 




CACCATGTGT 


ATATTTATTT 


TCCATAGTTT 


AGCCTACTTT 


CTAAAAATTG 


GTTCATTAAA 


4140 




TATATATACC 


CACTTTTAAT 


TGTTAATACC 


AAAAATATGT 


TTTTAAATAG 


AGAAAATGGT 


4200 


10 


AATAAATGAA 


ATTGATTTCT 


ATAGAGTGGG 


ACGAGAAAAT 


ATAGTTATAG 


CTGTCTATAA 


4260 


TGAGCATATT 


AAGTTTTTAT 


TTATACTGAT 


ATCTTGAATT 


TAATTAATAG 


AAACCTATAA 


4320 




AAAAACAGTA 


AGCCATTTAA 


ATGACTTACT 


GTTTTTTGAA 


TTAGGCCAAC 


AATATTAACG 


4360 


15 


TATACCTTTC 


ATCGCTTTGA 


TGATTAAAGG 


TGAGAATGCT 


AATACAATTG 


TTGTAACAAT 


4440 




AATTGCAACA ACACCTAGGA AAATAAAGTA ATTTGTTTGA CCTAGTGGTT CTATTAACTT 


4500 




AACTAAAGTA 


CCATTGATTG 


CTTGTGCAGA 


AGCGTTAGTT 


AAGTACCAAA 


TACTCATCAT 


4560 


20 


TTGGG CATTA 


AATGCTTTAG 


GTGCTAACTT 


AACAGCAGCA 


CTATTACCCG 


TTGGTGATAA 


4620 




GCATAGCTCA 


CCGATAACAC 


AAATAATGTA 


CGATAAAATA 


ACCCAGTTAA 


CTGAAAAGTT 


4680 




TGATGAACCT 


GATGCATAAC 


CTACAATACC 


AATTAGTATG 


TATGACGCAC 


CTGCTAAGAA 


4740 


25 


CGTACCAATT 


GCAAATTTTA 


CTGGCAGGCT 


AGGTTGTTTA 


GTTCCAAGCT 


TTTGCCATAA 


4800 




AAGTGAAATA 


ATTGGAGCTA 


GTAATAAAAT 


AAATAATGGG 


TTAATTGATT 


GGAAGATCGC 


4860 




TTCACCAAAG 


TTTGTTTTCC 


AACCAAATAA 


GTTTAATTTC 


ATATCTGAAT 


GTTCAATTCC 


4920 


30 


ATATATGTTT 


AATACATTAG 


ACCCTTGTTC 


TTGAATAGCC 


CAGAACACCA 


TTCCAAGAAT 


4980 




AAATAATGGA 


ATAAATGCTT 


TAACACGAGA ACGTTCAGTA 


TCAGTGACAT 


CTTTACTTCT 


5040 


35 


AATAATTAAA 


GTGAAGTAAA 


TGAnTGGTAA 


TGCAATACCT 


AATACTAAAA 


CAGTATTACT 


510O 


AACTAAGTTA AATGATAATG AGTTAGTTAA TGCACCAATA ACGATAATTA ATACAATTGC 


5160 




TAAfiACAACA CTTCCGATAA 


TAAGACCATA 


CTTTTTCTTT 


TCAGCTGGTG 


TCAATGGGTT 


5220 


40 


AGTAGGTTTC 


ATACCAACGC 


TACCTAAGTT 


TTTGCGGTTG 


AAAAGTACAT 


ACCATACTAA 


5280 




ACCTAATGCC 


ATACCAACTG 


CTGCAATCAA 


GAATCCGCCG 


TGGAAGTTTT 


TAACATTAAC 


5340 




AAAGTGTTGC 


AAAATAATAG 


GTGATAATAA . 


TGCACCCATA 


TTAACTGACA 


TATAGAAAAT 


5400 


45 


AACAAAACCT 


GCATCCATAC 


GTCTATCATT 


TTCAGGATAT 


AAACGGCCAA 


CGATATTTGA 


5460 




AATGTTTGGC 


TTCATTAAAC 


CTGAACCAAT 


AATGATGAAG 


AACATTGATG 


TGAATAAGCC 


5520 




GATTAATGCA AATGGTAAGC 


TTAAACAAAT 


ATGTCCGATA 


ATAATAAAGA 


CTGCACCTAA 


5580 


50 


TAAAGTAGCG 


CCTCTAGTGC 


CTGTAATTCT 


GTCAGCAATC 


CATCCGCCTG 


GTATTGATGT 


5640 




CATATAGATT AATGAACCAT 


ArACTGACAT 


AATTGACATA 


GCTGTTGTTT 


TATCAATTCC 


5700 
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(2) INFORMATION FOR SEQ ID NO: 191: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 14078 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

10 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 191: 
TGGACTATTA ACGGCGaAGA AGATTTAACG AAATACTTAC AAACCAATGT TGATGGTATT 60 
ATCACAGATG ACCCAGCATT AGCTGATCAG ATTAAAGAAG AAAAGAAAGA CGAAACATAC 120 

15 

TTCGATCGTT CTATAAGAAT TTTGTTTGAA TAATATAAAC AAAGACCTCT AAAGTTATCA 180 
AGATGATACC TTCAGAGGTC TTTTTAATGT TGCCATCTAT GGGATAGGCA ATCGTTTCAT 240 

20 TCGTTTATAT TCATATGACA AGTATTTGTA TGGCAATTTG GCGTCACAAA CACTTACATG 300 

ATTTATTGGT GAATTATTAA TTGTTTTGTG AATGCAAAGG GTTAGAAATT GAATTGTAAA 360 
TACTTTCTAA TCTTTGTTTC GCTTTAGTCA TTTGATCCAA ATTTTTAGTG CGTATAGCGG 420 

25 ATTTTGCAAT ATAGTGCGCA CTAAAATATC GCGTTTTTGA AACGCATCTA AATTTAGGTA 4 80. 

CGATAATTTA TTTAAGTCAG TGTTTGCTAT TAATTCATGT AATTGATCTA CAAGCGCTTG 540 
ATGTTGATAC GTATGTGATG TAGTTTCAGA TTTGCTTGCT AATTTAATAC CAGTCGTATC 6 00 

30 AAGGAGCGCC GCTTTAATAC CAGCAACTAA ATATGTTTTG ATTTTCATTT GTGTTGTCAT 660 

GCTTTGTTAC TCCTTTGATG TACATTAATC AAAAAAATTA TACACTATTG TATATTGCAA 720 

AGCTAATTAA CTATAACAAA AAGATAGTTA ATGCTTTGTT TATTCTAGTT AATATATAGT 780 

35 

TAATGTCTTT TAATATTTTG TTTCTTTAAT GTAGATTGGG CAATTACATT TTGGAGGAAT 840 

TAAAAAATTA TGAAAAAGCA AATAATTTCG CTAGGCGCAT TAGCAGTTGC ATCTAGCTTA 900 

TTTACATGGG ATAACAAAGC AGATGCGATA GTAACAAAGG ATTATAGTGG GAAATCACAA 960 

40 

GTTAATGCTG GGAGTAAAAA TGGGACATTA ATAGATAGCA GATATTTAAA TTCAGCTCTA 1020 

TATTATTTGG AAGACTATAT AATTTATGCT ATAGGATTAA CTAATAAATA TGAATATGGA 1080 

4$ GATAATATTT ATAAAGAAGC TAAAGATAGG TTGTTGGAAA AGGTATTAAG GGAAGATCAA 1140 

TATCTTTTGG AGAGAAAGAA ATCTCAATAT GAAGATTATA AACAATGGTA TGCAAATTAT 1200 

AAAAAAGAAA ATCCTCGTAC AGATTTAAAA ATGGCTAATT TTCATAAATA TAATTTAGAA 1260 

50 GAACTTTCGA TGAAAGAATA CAATGAACTA CAGGATGCAT TAAAGAGAGC ACTGGATGAT 1320 

TTTCACAGAG AAGTTAAAGA TATTAAGGAT AAGAATTCAG ACTTGAAAAC TTTTAATGCA 1380 
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GTTGTATCAT ATTATGGTGA TAAGGATTAT GGGGAGCACG CGAAAGAGTT ACGAGCAAAA 1500 

CTGGACTTAA TCCTTGGAGA TACAGACAAT CCACATAAAA TTACAAATGA ACGTATTAAA 1560 

AAAGAAATGA TTGATGACTT AAATTCAATT ATTGATGATT TCTTTATGGA AACTAAACAA 1620 

AATAGACCGA AATCTATAAC GAAATATAAT CCTACAACAC ATAACTATAA AACAAATAGT 1680 

GATAATAAAC CTAATTTTGA TAAATTAGTT GAAGAAACGA AAAAAGCAGT TAAAGAAGCA 1740 

GATGATTCTT GGAAAAAGAA AACTGTCAAA AAATACGGAG AAACTGAAAC AAAATCGCCA 1800 

GTAGTAAAAG AAGAGAAGAA AGTTGAAGAA CCTCAAGCAC CTAAAGTTGA TAACCAACAA 1860 

GAGGTTAAAA CTACGGCTGG TAAAGCTGAA GAAACAACAC AACCAGTTGC ACAACCATTA 192 0 

GTTAAAATTC CACAGGGCAC AATTACAGGT GAAATTGTAA AAGGTCCGGA ATATCCAACG 1980 

ATGGAAAATA AAACGGTACA AGGTGAAATC GTTCAAGGTC CCGATTTTCT AACAATGGAA 2040 

CAAAGCGGCC CATCATTAAG CAATAATTAT ACAAACCCAC CGTTAACGAA CCCTATTTTA 2100 

GAAGGTCTTG AAGGTAGCTC ATCTAAACTT GAAATAAAAC CACAAGGTAC TGAaTCAACG 2160 

TTAAAAGGTA CTCAAGGAGA ATCAAGTGAT ATTGAAGTTA AACCTCAAGC AACTGAAACA 2220 

ACAGAAGCTT CTCAATATGG TCCGAGACCG CAATTTAACA AAACACCTAA ATATGTTAAA 2280 

TATAGAGATG CTGGTACAGG TATCCGTGAA TACAACGATG GAACATTTGG ATATGAAGCG 234 0 

AGACCAAGAT TCAATAAGCC ATCAGAAACA AATGCATATA ACGTAACAAC ACATGCAAAT 2400 

30 GGTCAAGTAT CATACGGAGC TCGTCCGACA TACAAGAAGC CAAGCGAAAC GAATGCATAC 2460 

AATGTAACAA CACATGCAAA CGGCCAAGTA TCATACGGAG CTCGTCCGAC ACAAAACAAG 2520 

CCAAGCAAAA CAAACGCATA TAACGTAACA ACACATGGAA ACGGCCAAGT ATCATATGGC 2580 

GCTCGCCCAA CACAAAACAA GCCAAGCAAA ACAAATGCAT ACAACGTAAC AACACATGCA 2640 

AACGGTCAAG TGTCATACGG AGCTCGCCCG ACATACAAGA AGCCAAGTAA AACAAATGCA 2700 

TACAATGTAA CAACACATGC AGATGGTACT GCGACATATG GGCCTAGAGT AACAAAATAA 2760 

GTTTGTAACT CTATCCAAAG ACATACAGTC AATACAAAAC ATTACGTATC TTTACAACAG 2820 

TAATCATGCA TTCTATGATG CTTCTAACTG AATTAAAGCA TCGAACAATC GGAAGCATAT 2880 

TTCTAAATTA TTTATTCATT ATAGTCTTAA ACATAACATG ACCTAATATA TTACTAACCT 2940 

ATTAAAATAA ACCACGCACA TCTAAGTGAT ATACGACAAT CACAGCAATA ATAATTGCTT 3000 

TAGAAAGTCG TGCCGAACTG GAACTTACAA GTCTAGTTCG AACACACACT GATGTGAGTG 3060 

50 GTTTTCTTTA TTTTAAACAT GAACAATCAG ATAAGTTACT AGCATTAGCA AATATTATTA 3120 

AATCAAAGGG CTTCGATTCA TAAAATTTAA AACAATGATT AAAATTAGAC GTGTAAATGT 3180 
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TATTTCACAC AGCTTCATTA ATAAAACGAA ATTGCTTCAA CCCGCTTCAA CTTCAACTGG 3300 

CTTCAACTTC AGCCTACTTC ATTCAATAAC AAAACGAATC CGCTTCATCC AAAATCAACC 3360 

ATTCTAACGC ACATATTCAA ATATAGCAGC TGCACCCATG CCGACACCAA TACACATCGT 3420 

AACCATGCCG TAACGGCTAT CGGGACGTCT ACCCATTTCA TTAAGTAAAC GCGCGGTTAA 34 80 

CATTGCGCCT GTAGCACCTA ATGGATGACC TAAAGCAATA GCGCCACCAT TCACATTCGT 3540 

ACGTGATATA TCTAGACCTA CTTCTTTAAT AGATGCAATC GTTTGAGAAG CAAATGCTTC 3600 

GTTCAATTCG ATCAAATCAA TGTCTTCAAC AGATAGATTG CTGAGTGACA ATACTTCAGG 3660 

AATCGCATAT GCAGGCCCAA TACCCATAAT TTTCGGGTCA ACGCCTACTG CCTTAAAACC 3720 

AACGAATCGT GCAATAGGTG TCACGCCGAG TTCTTTCACT TTATCTCCAG ACATTAAAAC 3790 

TACAAATCCT GCACCATCAG AAAGTGGGGC AGATGTTCCT GCAGTCATAG TGCCGTCAGC 3840 

TTTAAATACT GTACGTAATT TGGCTAATGC CTCCATCGTG GTGTCAGGGC GTATAAATTC 3 900 

ATCTTGGTCA AAGATATTTG TGTGTACTTT TGGTCCTGCG TTTGTATATT CAACTGAGTT 3960 

TACTTGTATT GGAATAATTT CATCTTTGAA CCGACCATCA CGTTGTGCGT CATAGGCACG 4020 

25 TTGATGACTT CTGACAGCAT AAGCATCTTG ATCTTCGCGT GATACGTCAA ATTGGGATGC 40B0 

TACATTTTCA GCAGTTAAAC CCATAGGATA TGACGCACCT ATATCATCAT ATTGTAAGGT 4140 

TGGATTGTTT GTGGGCTCGT TGCCACCCAT TGGTACGGCA CTCATCAATT CAACGCCACC 4200 

30 AGCTACAAGT ATATCTCCTT GACCAGCCAT AATTTGATTG GCTGCAATCG CGATGGTTTG 4260 

TAATCCTGAT GAGCAGTAGC GATTCACTGT TTGACCCGGT ACCGTGTCAG ATAATCCCGC 4320 

ACGCAATGCA ATCGTTCGTG CAATGTTTTG GCCTTGTAAT CCTTCTGGAA AAGCCGTACC 4380 

AACAATGACA TCTTCAATCA TATTCTTATT GAATTTTCCG TCAATACGTT TCAATACGCC 4440 

TTGTAATACT TTGGCTGCGA CATCATCAGG TCTTTCGTGG AATAATGCGC CTTGCTTTGC 4500 

TTTCGCTGCG GCTGAACGCC CATAAGCTAC AATGTATGCT TCTTGCATGG TTATCATCCT 4560 

CTCTTAATGA CTATCTTTTA ATTACGTAAT GGCTTACCAG TTTTTAACAT ATGTGCAATT 4620 

CTTTCATATG ATTTTTTAGA TTTTAGTAAG TCAATAAAGC CAATTTTCTC CAACGATTGA 4680 

ATGTAACGTT GATTGATAAA TGTATTTCTT GGTAAATCAC CACCCGCTAA AATTGTGGCG 4740 

ATATTTAAGG CAATATGATA ATCATGGTCG CTAATAAAAT GACCCCGTCT TTGCGCATCT 4800 

AATTGTCCTT GGATCAATGC TTTGAAGTCT TCACCTAAAG CGATATATTG ATGTCTAGGA 4860 

SO TTCGGAATAT AGTTTGTTTC TGCTTCATAT TTCGCACGTT TGAGCGCAAC TTCGACACGT 4920 

TGTGCTGTAT TGAAAATAAT CGTATCTGTA TCACGTAAAT AACCATAACG ACGTGCCTCA 4980 
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TGTTTGTCAT CAAACTTATG CGATGTGCGT AATATGCGAT CAGCCATTTC TGCAAGGCCA 5100 

CCGCCACTCG GTAATAAGCC AACACCTGCT TCAACAAGAC CGATATATGT TTCACTTGCA 5160 

GCGACAACAA TAGGTGAGTA AAGTACAAGC TCACAGCCAC CGCCTAAGGC ACGACCTTGA 5220 

ACAGCTGTGA CTACTGGTTT CAAACTATAC TTCAAACGAT TAAAGCTATA ATGTAATTTA 5280 

TCAATTGATT GTGCAACGAC ATCATCTACA AGACCGTCTT CATGCGCCTT TTTCATTAAG 5340 

AAAAGGTTAG CACCCACACT GAAATTGTTA CCATCTGCAT AAATAACCAT ACTTGTGTAA 5400 

TGGTCATTTT CCAGTAAATC AATCGCATCA ACTAACGCAT CGTTGAATTC ATCGGTAATG 54 60 

ACATTATTTT TACTTTGTAA TTTCAGTAAC AGTTGATCAT CATGAGTTAC GGAAAGTTTG 5520 

GCATCACCTT TATCCCAAAG TTCATCTTTT ACGAAGTGAG AAATAGGTGT TGCATATTCA 5580 

ATGGTCTCAT CTTGTTTATA AAAGCCACCA TCTAAATCAC TAATCCATTG TGGTAAGTCT 5640 

CCAAGTTCGT CTTCCATACG TGTTTTAACA CGTTCGTATC CCATTGCATC CCATAATTGG 5700 

AATGGACCAA GTTTCCAGTT GAACCCCCAG ACAAGCGCAC GGTCTATGTC TCGGAAATCA 5760 

TCGGTAGCTT TAGGTACATT GATAGCAGAG TAATAGAAAT TATTACGTAA TGTCTCCCAT 5820 

AAAAATAGTC CCGCTTCGTC TTGCGCATTG AATATGGTAT CAAGGTTATG CACTAAGTCT 5880 

TTATTAAATT CATTTAAAAT TGGTAATTGT GGTTGCGATA CAGGTACATA ATCTTGTTTT 5940 

TCAACATCGT AAACAAGTCG AGCTTTAGTT TCTTTATCCT TTTTGTAAAA TCCTTGTTTC 6000 

30 GTTTTACGTC CGAGTGCGCC ATTGTCAAAC AACGTATTTA CAATTTTGAC ATCATGAAAA 6060 

TAAGGTGTTT CTTCAGGTAC TTGTTGCATG CCTTTAATTA CAGACACTGC AATATCTAAA 6120 

CCGACTAGGT CAGATAGCGC ATATGTACCT GTTTTAGGAC GACCAATCGC TTGCCCAGTT 6180 

AAAGCATCCA CATCTACAAT GCTTATCTTG TGTTGCTCGG CGCGATACAT AATATCATTC 6240 

ATTQJTTGCG TGCCGACTCT ATTTGCGACA AAGCCAGGCA CATCATTGAC GACAATGACA 6300 

CCTTTACCTA ACACATTTTG CGCGAAATTT TTTACATCTA ATATAATAGA TTCCTTCGTG 6360 

TGTGACGTAG GTATTAACTC CACTAATTTC ATAATACGTG GTGGGTTAAA GAAATGTAGA 6420 

CCAAAGAATC GTTCTTGATC CTTCTCGTTA AATGCTTGAG CAATCGCATT AATTGGAATA 6480 

CCTGATGTAT TTGTAGCGAA TAAAGCATCT TCTTTAGCAT GTTGTAGAAC TTGTTGCCAA 6540 

ACAGCATGCT TAATTTCAAT ATCTTCTTTG ACTGCTTCGA TATATAAATC AGCATCATCA 6600 

TTTACCAAGT CATCATCAAA ATTACCATAT GTTAAATGAC TCGCTAGATT TAAGTCGAAT 6660 

AGTAGCGGCC GTTTCTTATC TGTAATTTTA TCGTAAGATT TTTTCGCAAT GAGATTTGGA 6720 

TCGTTTTTGT CCACTACAAT ATCTAATAGT TTTACTTTAA GTCCAGCATT CACAAAAAGT 6780 
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GTGATTCCTC CAATTTAGTT GAGGATAAGA TAACCATTAA GATAATTGGA ATAACGTTGC 6900 

TATTTTATAA AATTAATTAA GTATCTTTGA CAGTCATCTT AGCCTCTTAT TTAAGGAAAA 6960 

AGCTTTATGC TTAAAATAAG TCTTTTTTAG TGAAATTAAT GCATCTCATA TAATTATTTG 7020 

CTATTTATAC GAAAGCAGAA TCTCCAGTCA AAGCGCGTCC AATTACTAAG GCATTAATTT 7080 

CATGTGTACC TTCGTACGTG TAAATCGCTT CTGCATCAGA GAAGAAACGT GCAATATCAT 714 0 

AATCGTCAGC TAGTATGCCA TTACCACCTG TAATACCGCG GCCCATAGCT ACTGTCTCAC 7200 

GCAAACGTAA GGCATTCATC ATCTTCGCCG TTGAAGTTGC AACCTCGTCA TATTCACCAT 7260 

GTGCTTGCAT ATTAGCTAAT TGAGCACATG TTGCCATTGC TTGAGCTAAA TTACCTTGCA 7320 

TCATTGCTAG CTTTTCTTGT ATTAACTGAT ATTTACTAAT TGGTTTGCCG AATTGcTTAC 7380 

GCTCAGTGAC ATAATCTAAT GTGGCACGTA AAGCGCCAGC CATACCACCT GTAGCCATAT 7440 

AAGCAACGCC TGCTCTCGTT GAATAAAGAA TTTTGGCAAT ATCTTTAAAG CTTGTTATGT 7500 

TTTGTAAGCG ATCCGCTTCA TCTACTTTGA CATTAGTTAA TTTAATTAGG GCGTTAGGAA 7560 

CAATGCGAAG TGCGATTTTA TTATCAATGA CTTCAATATC GACGCCATCT TGTTCTGGTC 7620 

2S TGACTACAAA GCAATGGGGT TTGCCAGTTT CTTTATTTAC TGCGAATACT GGAATGACAT 7680 

CAGATACATG TGCACCACCA ATCCATTTCT TTTCACCATT GATAACCCAA GTATCGCCTT 7740 

GGCGTTCAGC GACTGTTTCA AGACCTCCCG CAACGTCCGA ACCGTGTTCT GGTTCAGTTA 7800 

30 AAGCAAAGCA TGTACGCAGT TCATGTGACT GTAATTTAGG TACATATTTC GCAATTTGTT 7860 

CTTTGCTACC TCCGAAATAG AAAGTGTTAT GCCCTAAACC TTGGTGAACA CCGAGTAGGG 7920 

TAGCTAAGGA AATATCAAAT CGCGCGAGTA GGTAAGACAT GAAAAACTGA AATAGTTGAC 7980 

TAGGCATTTT GGCGTTTGGA CGATCCTTGT AAAGTAATGG ATTGTTAAAA TAATTTAATT 8040 

CTC&AGATC TTTAAAATAG TCCTCGGGTA CAGTAGCGTC TATCCAATGT TGATTAATAT 8100 

TTTCACGGTA CTTACTTTCT AGCAATGAAT CTACTTGTTG TAAAAATTCG ACTTCACCGT 8160 

CTGTTAAACC TTTAGCAATA CTAAGTACAT CTTCAGGAAA TAATGTTTTT AAGACCGTTT 8220 

CTTTTTCAAA TGTCATATAA ATTCCTCCTA AAAATAATAT GAATACTAAT GTGAAATGCA 8280 

TTTAATTCAA AAACAACACG CTTTATTTGT AAACGCTTAC ACTAAATGTC AAAAATTTTT 8340 

ATCACCTTTA AAGTGTTTGC GAGACTTTGT CATTCATCAT TTGTCGAATC GCAAGTTTAT 8400 

CTGGTTTCTG CGTACTGTTT AACGGCATAT GTGTCACTGG TACATACATT CTTGGGACTT 8460 

SO TATAACCTGC TAAACGACTt CGCATATGTT GATTTAAAAT TTCAGCGTAA TGAGGTTCAT 8520 

CTTCGCGAAG TATAATGGCT GCAGCAATTG ATTCACCATA TTTTGGATGA TCATAGCCAA 8580 
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AGACATTTTC GCCACCAGTT ATGATTAATT CTTTTTTGCG GTCAATAATA AATATATCGC 8700 

CATCGTTGTC CATCTTCGCT AAGTCACCAG TTAATAAATA TCGACCATGA AATGCTTTGG 8760 

CAGTCTCTGC TGGTTTATTC CAATATCCTG GCGTGACATT TTTAGCCTTA ATTGCAAGTT 8820 

CGCCAATCTC ACCAGTAGGT ACTTCCTCAC CGTTATCATC AAGGATACGT GCATCAACGA 8880 

ACATGACTGC TTTACCAATA CTCATTGGCT TACGTTTTGA ATTTTCCGGT GTATTAACAA 8940 

GTACAAGAGG TGCTTCAGTT AAACCATAGC CGTTAATAAT GTTTATGCCA TATTGTTTAA 9000 

AAGCTGCTTG GATACTTGGT AATGGTTGTG AACCACCTTG GATGATATAA TCCATAGCTC 9060 

TAAAATTTTC AGGATTAAAA TTACTAGCAC GTAGCGTACT ATAATACATT GTCGGAATCA 9120 

TGATAATAAA TGTAGGGTGA TATTGTGCAA TCATGTCATT CAATTCTTCG CCGTTAAAGT 9180 

AACGTTGAAG AATAAGTGTG CCACCTGACA TTAATACTGG TAATACAGTA TCGTTAAACC 9240 

CTAAAACATG GAACATTGGT GTTGATACAA TCGTAATATA GTTTGAATTG AACTTATACG 9300 

TCAGCTCTAA GTTTGCACCG TTATGAACAA ATGATTCATA TGAGAACATC ACACCTTTAG 9360 

GTGATCCGGT TGTACCACTT GTATAAATTA ATGCTGCAAG ATCTTGTGGT TCAACAGGTG 9420 

TTGCTTGAAA AGGTTGGTGA TAATCTGGAT TTACGATTTC ATCATATTGC GCCACATCAA 9480 

TATCCATATG CAATAAGTTT TGGTCAATAT CGGTGAGTGA ACTTAAATGT TTTTCAG CAT 9540 

AGAAGAGCAG TTTTAATTGT GCATCTTCCA CAATGGCTGC AATTTCTTTT GGGTTAAGCC 9600 

GCCAATTCAA TGGTAAAAAA ACCGCACCTG TTTTAAAACA AGCAAACAAT AAATCTAATA 9660 

TTGCAATATC ATTTGGCGCA AAAATACCGA TAACATCGCC TTTTTTAACA CCTTGAGATG 9720 

TTAAATAATG TGCCATATTA TCAGCGCGTG CATTGAGTTG TTGGTATGTC CAAGATGTTT 9780 

GTTTTGCGTG ATCAATAACG GCAGGCTTGT CATCATCGAA GTCTGAACGC GTTTTTATCC 9840 

AATGGAAATT CATTAGTATA CCCCCTTTAG CTTCACTTTC ATACTTTATG AATTGATTGT 9900 

TTAAGTTGTC CCCATTTTTC TTTGTAAATG CTGGTATCAA TTAATTTTAA ATGATCAGCA 9960 

ATAATTGGTT TAAAAGCCAT TTGATTCAAA ATATCTTTAT GCAAATCAAG ACCTGGTGCA 10020 

ATTTCAATTA GTTTCAAGCC TTGATTGGTG AGTTCGAATA CTGCACGATC AGTAACAAAA 10080 

TAGATTTCTT GCTCGAGTGA TTGTGAATAT TGTGCATTAA AGTCGATATG GCTCACATCT 10140 

GATACAAATT TCTGGTTTTG TCCTTCAGTT TCAATGTTTA ATCGTTGATT ATGGCATGAG 10200 

ACATGACTGC CAGCTACAAA AGTACCTGAA AAGATAATTT TATTTACAGA TTGCGTAATG 10260 

TCTATAAAGC CACCACATCC ATTTAGTCGG TCATTGAAGT AAGACACGTT GACATTGCCG 10320 

TATTGATCAA CCTCAGCAAA GCTAAGATAG GCAACTGATA CACCATTGTT ATAAATAAAA 10380 
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CGACTCCCAA CGAATCCACC GAAAATGCCA ACATCTAAAA TCGGTTGCAC ATCATGTTCA 10500 

ACACATTCTT CATGCAATAA ATTAGAGAGT TCATTATTGA TGCCATAACC GATGCTAATT 10560 

5 GTATCGCCAT AAGTTAAAAA CTGAGCAGCA CGTCGGAGAA TCAATTTGCG ACTATTAAAA 10620 

GGTAATGCGG GTTCAGGTAT TCCATCAATT CGTTCTTCTC CAGACAAGGC TGGTAAATAA 10680 

TGACTTTGAA TTACTTGGCG GTGATTCTTT TCATCTTCTG TGACGTATAC ATAATCGACA 10740 

10 

AGATTTCCTG GGATAACAAC TTCATTCGGT TTTAGTTGAT AGTCGTCAAC TAAAGCTTTA 10800 

ACTTGTACAA TAACTTTCCC ATGATTGGCT TTCGCGTTTA ATGCGACATG ATAACACTCG 10860 

CTCAAGTACG CTTCTTGAGT TAAATAAATG TTACCTTGTT GATCTGCGTA TGTTCCTCTC 10920 

15 

AGTAGTGCCA CATCAACGCT AGGGAATGTG TAATGTAAGT ATGTTTCATC GTTGATGGTT 10980 

ACTAATGAAA CTAAATCATC CGTTGTTCGT GTATTTACTT TACCGCCACC GTATCTAGGA 11040 

20 TCAACAGCTG TGTTTAATCC GATTTTAGTA ATAACTCCAG GTAATAATTG ATTACTCTGA 11100 

CGATAATGAG TTGCAATGAT ACCTTGTGGT AAAAAATAAG CTTCAATGTC ATTATTTTTC 11160 

ATTGcTTGTG CCGTTTTGGA AGAAGCCGTT AAAATACTCA TAATGACACG TTTAATCATG 11220 

25 CGACGTTCTA TAAAATCATC TAAATCCGGT GCGGCACCTA AACTATGAAT ATCATTCGCT 11280 

AATATAAACG TTAAATCATT GGGCGTATGA TATGTGTCAT GTTGCGCTAA CACAGCACGT 11340 

AGAACTTCGG CGGGTAAGTT GGCTACAGCT AATGCTGGTA AACCAATCAC ATCACCATCT 11400 

30 TTAATGATAT GTTGTAAGTC GTGCCATGTG ATTTGTTTCA AGCAAGTCAC CTCCATCACA 11460 

TTTGATAAAA TATAGCGTTT TTACACTTTG TGTAAACCCT TaCAAGAAAT ATAACATAAC 11520 

GACGTTTAAA ATCAATTAGA AATATCTTTT TATTCTGATA ATAGACACAG TATAGACACA 11580 

35 

TTTTGATGGT CGATAACAAT TGTAATATCA AGGGTTTGTA ATGAATTGAA TATCATTAAA 11640 

ATACTTATAT AAAAATATTG TTCGGAATAT AAAAAGTTAA ATAGGTTTTG ATTTTTAAAT 11700 

ATGAAATACA AAGTGCCCAA TCGAACAAAG TATTTATATT AAAATATGGA AAATCCATCA 11760 

40 

ATATTAAATT AAAATAGTTT TATTATGAAA AGTGAAAGTA GGTAAGTCTA TGGAAGGTCT 11B20 

TAATCATCGA AGAAATACAG AAAAAGAAGA GACAACACAA ACGCAATCaG TTGCACCTAA 11880 

TACAGGTGAA GAGGGGATGT CATCAGCAAG TACACAATCA ACTAAGACGT CCGACATACA 11940 

45 

TAATGAATCT ATCGATAAAC AAATGGAAGC TAAAGCGCAT GAAACAGCGC AAAATACAGA 12000 

TTTAAAAAAC GAAGCAAGAA GTTTATTTGA TAATGCAACC AAATCAATCG GTAGACTAGC 12060 

50 GGGCAATGAT GAAAGCTTAA ATCTTAATTT AAAAGATATG CTTTCTGAAG TATTTAAGCC 12120 

GCATACTAAA AACGAAGCAG ATGAAATATT TATAGCGGGT ACTGCTAAAA CTACGCCAGC 12180 
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TTTCACAGTA 
GATTCCGGGT 
TTATGAATCA 
TGGCGGCGTA 
TCAATTCGAA 
AGAAACTGGA 
TTTGAATGGA 
AGGTTATATT 
ACGTGCGTGG 
AGTTATTGCG 
AATATTCTTT 
TGGCAGTGAT 
TTTAATGGGG 
GAAAAAAGTA 
ATTTTTATAA 
TTtCACGTTA 
GTATGTAATA 
AATTAAACCA 
GGCTGAGACA 
ATTAAATAGA 
ATTT35ATCGT 
TCATTAGAAA 
TCATCGACGT 
TGATTAAAGA 
TCCCATGCAG 
TCAATATTTG 
CGACCGTCAT. 
GCTAATAACA 
GGAATTTTAT 



ACATTTATTG 
CTCATTTTTA 
AATGCGTTTA 
TTTTCATTAC 
AGGTTTGGTT 
AAAGCACTCA 
TTATTAATCG 
TTGAATTTCG 
ACTGCGATTG 
AAAGAACAGC 
TTATCAGCCG 
ACGTTGAAAA 
GCAGGTTTAA 
GACGAATAAT 
TTTGTCTTTA 
AACAAATAGT 
ATCATTTTAT 
CGCCATAATC 
TAAATCAATG 
TACCTTCAGG 
TGTAAGCAAT 
TATTGTGACG 
TGCTATTATT 
AATAACCTGT 
AACGGTCTTT 
CTTTTTTAGC 
ACGTAATTAA 
TTTTTGCTTG 
CATTAAATGG 



GATTATGGGT 
TAGGGGCTTT 
AAAATATTAG 
TAAGTACGAT 
CTTTAACATT 
TTATTGTTTA 
GTGCTGCTAT 
CTTTAGGAGA 
GTGGTCATTT 
ATGGCTTTGA 
TTGTTTTACA 
TATTTATTTT 
AACAAGTGAA 
AATTAAAGCT 
AAAGAGTGGA 
GACAATTAGA 
TGAAATTCAT 
ATATTGGATG 
TCCCACACTC 
TGTTACTTTA 
ATAACTGTTT 
TTCCTTAACA 
GTAGTCTCCT 
ATCTCCACGA 
TAAGTAACCT 
ATCTGATTGT 
CTTAATTTTT 
TTCGATATTT 
ACTCGTTGCA 



CATGGCAGCA 
AACAGTACCA 
CATTTTTGAA 
GGTATTATAT 
TTTCGATGCA 
TTTCGTCAAT 
TGGTGCAGGG 
AAATGTCCCA 
AGTTTGGTCA 
ATTCAAAGAT 
TGGCATTTGG 
AATCGTTATT 
TTTACTGCAG 
TATGTTGCTC 
ATAGGAATAC 
TTTATATAAA 
CAAACAGAAA 
ACTTCGGCGT 
CCTTATCGTT 
TAATTTTTAA 
GGTACATCTC 
TCTACAGTAT 
TTATTAATAG 
GGAATTGTTC 
TCTATGTCAT 
AATACTTGCG 
AAAGGGTGTT 
TGTTTGGTTA 
GGTTTCGCAT 



ATTTTTAATA 
TTATCGGGTT 
GTTATTATCA 
AGATTTGTCG 
TTTTTAGTAG 
AAATTGAAAA 
TTCGCAGTTT 
TTATTAGATA 
kCGATTGTTG 
ATTTTTGATA 
GATACATCTT 
GTGTGGATAC 
AAAGAATTTA 
ATATGTTTGT 
TTTTTGGAGT 
ATGAACATGA 
TTAATACAAT 
GGTTTTTATA 
CAATCGTTGT 
CCTTAGAGTT 
GACTTGATAA 
GATTCAATTG 
CACCATCTTT 
CGAAACTATA 
CAACACTTTT 
CAATTTTCGA 
CTTTTGTATA 
ACTTAGGTTC 
AACCTTGATA 



ACACTAACGC 
TGTTCTTCTT 
TGTTCTTTAT 
TTTTTAGTGA 
GATTAGTTGA 
CAAATAAGAT 
TTGAATCAGC 
TTGTCTTCAC 
GTGCTGCAAT 
AACGCTTTTT' 
TAACTGTACT 
TTGTATTCaT 
AAGAACAACA 
GACATAAGCT 
TAAAAAAGTG 
TTCACTGAAA 
CATATAAGCA 
GTTGAAGCAG 
TCGATAATCG 
AGCAGCGACT 
TTTAATAATA 
ATTAATTAAA 
TTTATATGCT 
CATCGTTGCA 
AATGTCGATT 
TAGCTCTGGA 
ACCATCTTTA 
TTTAATATAT 
AATATGATCT 



12300 
12360 
12420 
12480 
12540 
12600 
12660 
12720 
12780 
12840 
12900 
12960 
13020 
13080 
13140 
13200 
13260 
13320 
13380 
13440 
13500 
13560 
13620 
13680 
13740 
13800 
13860 
13920 
13980 
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TTATtAGTAT GATTATACAT AAGTaAGAAG TTCTAAAn 14078 
(2) INFORMATION FOR SEQ ID NO: 192: 

5 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4 86 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

10 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 192: 
TGAAAACTAA AGTGTTTCTA ATGCGTGACT AAAATTAGTA ATAATTAAGT TCTCATGATA 60 

ATAGGTATTT TTGAAAAATG GAGGAGTCTA TAAATGGGTA AAAAAATGGG TCTAGGTTTA 120 

TCTATTGCAT TGGTTGTTAT TGGTATTGCC GTTGTATGTT TAATGATTTT TTCTAGTCAA 180 

AAAACGACTT ATTTTGGTTA TATGAATAGT AATACAAATG CAGAAAAAGT TGTCAGTGAA 240 

AAAGATGGAT TAGTCAAACA TAATATCAAA GTAGAACCAT CTAATGATTT CAAGCCGAAA 300 

AAAGGAGACT TTGTAAAATT AGTTTCTAAA GATGATGGGA AGACATTTTA TAAACAAGAG 360 

ATTGTTAAAC ATGATGACGT CCCACACGGT TTAATGATGA AAATTCACGA CATGCATATG 420 

AATTAATAAA AAAGCATCTA TAACGTAATT TTGAAGAAGT AGAGTTATCT TCTTATGCGT 4 80 

TTTAGA 4 86 



(2) INFORMATION FOR SEQ ID NO: 193: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1626 base pairs 

(B) TYPE: nucleic acid 
35 (C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 193: 
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GAGGTCTATA 


TACAATTATG 


GTTGTTCCAG 


TTAAACGAAC 


TGATGGCTTT 


ATTACTAAGT 


60 


TTAATAGATT 


AATTGAAAGA 


CGATTATTAC 


GTCATTTCAG 


TAAAAAAGGT 


TATATCACAT 


120 


GGGAGGAAAA 


TTGATTGTCT 


GACATTTTAA 


AATGTATCGG 


TTGTGGTGCG 


CCACTTCAAT 


180 


CTGAAGATAA AAATAAACCT 


GGTTTTGTAC 


CAGAGCATAA 


TATGTTTCGT 


GATGACGTGA 


240 


TTTGCAGACG 


TTGTTTCCGC 


TTGAAAAATT 


ATAACGAATT 


CAAGATGTAG 


GATTAGAAAG 


300 


TGAAGACTTT 


TTAAAATTAT 


TATCAGGACT 


TGCGGATAAA 


AAGGGTATTG 


TCGTCAATGT 


360 


CGTGGATGTA 


TTTGACTTTG 


AAGGATCATT 


TATTAATGCA 


GTTAAACGTA 


TTGTCGGAAA 


420 
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TCGAGTTAAA GAATGGTTAA AACGAACAGC AAGAAAATAT GGTTTGGAAG CTGACGATGT 540 

CGTATTAATT TCAGCTGAAA AAGGCTGGGG CATAGACGAC TT ATT AT CAT CAATTGCGAA 600 

5 TATTCGAGAA AATGAAGATG TGTATATTGT AGGGACAACG AATGTTGGGA AATCTACATT 660 

GATTAATAAA CTGATTGAAG CTAGTGTTGG TGAAAAAGAT GTAGTAACAA CTTCAAGATT 720 

CCCTGGAACA ACTTTAGATA TGATAGATAT TCCTTTAGAT GAAACATCAT TTATGTATGA 780 

10 TACACCAGGT ATTATTCAAG ATCACCAAAT GACGCATTTA GTTAGTGAAA AAGAATTGAA 84 0 

AATTATTATG CCTAAGAAAG AAATAAAACA ACGCGTATAT CAATTAAATG AGGCGCAGAC 900 

ATTATTCTTC GGCGGTCTAG CGCGCATAGA TTATGTATCA GGTGGTAAAC GTCCGTTAGT 960 

15 

TTGTTTCTTT TCTAATGACT TGAATATACA TCGTACTAAm ACGGAGAAGG CTAATGATTT 1020 

ATGGCGTAAT CAACTTGGCG ATTTATTAAC GCCACCTGGA AATCCACAAA ATTTTGATCT 1080 

TAATGAGGTA AAGGCTGTTA GACTTGAAAC AGGCAAAGAG AAACGCGATG TTATGATCTC 114 0 

20 

TGGTCTAGGC TTTATAACTA TAGGACCAGG GGCTAAAGTA ATCGTTCGTG TTCCTAAAAA 1200 

TGTTGAkGTT GTATTAAGAA ATTCTATTTT ATAAGGTGaT TAAAAAAATG AAATTTGcAG 1260 

25 TTATAGGAAA TCCTATTTCA CATTCCTTGT CGCCCGTTAT GCATAGAGCA AATTTTAATT 1320 

CTTTAGGATT AGATGATACT TATGAAGCTT TAAATATTnC CAATTGAAGA TTTTCATTTA 1380 

ATTAAAGAAA TTATTTCGAA AAAAGAATTa GAAGGCTTTA ATATCACAAT TCCTCATAAA 1440 

30 GAACGTATCA TACCGTATTT AGATTATGTT GATGAACAAG CGATTAATGC AGGTGCAGTT 1500 

AACACTGTTT tGATAAAAGA TGGCAAGTGG ATAGGGTATA ATACAGATGG TATTGGTTAT 1560 

GTTAAAGGAT TGCACAGCGT TTAnCCAGAT TTAGAAAATG CATACATTTT AATTTTGGGC 1620 

35 GCAGGT 1626 

(2) Information for seq id NO: 194: 

(i) SEQUENCE CHARACTERISTICS: 
40 (A) LENGTH: 635 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY : linear 

45 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 194: 
AGGGTTAATT GTCGGTTTAA TTGCAATGAA TAAGTTCCAT GTATTAGCTG GCTATAGAGC 60 
SO GAAATTCATC TTAATGGTGA TTTTAACTAT GATGGTCTTC GTACTTATTA ATACGTATTT 120 

ACTAAGACAG GTAAAATCTA TCGGTATGTT CTTAATGATT GCTGCATTGG GTCTATACTT 180 
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GTCTTATATC GATAACATGT TCTTCAATTA TTTAAATGCA GAGCATCCTA TAGGCTTGGT 300 

GCTAGTAATA TTAACAGTAC TTGTGATTAT TGGCTTTGTA CTGAACATGT TTATAAAACA 360 

CTTTAAGAAA GAGAGATTAA TCTAATGTTG ATGAATAGCG TGATTGCTTT AACTTTTTTA 420 

ACAGCATCTA GCAATAATGG CGGACTTAAT ATTGATGTGC AACAAGAAGA GGAAAAGCGA 480 > 

ATCAATAATG ATTTAAATCA ATATGATACA ACGCTATTTA ATAAAGACAG CAAAGCGGTT 540 

AATGATGCGA TTGCTAAGCA GAAAAAAGAA CGACAACAAC AAATAAAAAA TGATATGTTT 600 

CAAAATGAAG CGAGTCACTC GACTCGCTTG AATGA 635 
(2) INFORMATION FOR SEQ ID NO: 195: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 13715 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 195: 

25 CTGAAATGGG TATTATTTGT CTTCTTCATC ATAAAGTAAT AAAGATTGTT CATCATTGCG 60 

ACGTTGCCAA TTTTCATTTG GCGATCTTGG AACGTATAAT AATTGCCTAG TAGCATACGC 120 

TTTGATTGAA ACATACAAGT CATTCCTTGA ACTTGCACCT CAATTTCCAC ATTTGAATTT 180 

30 TCTTTTATAT TAATAATTTC ATCCAAATTC AGCTCACGTG CTAAGACAGC TCTTGATGCG 240 

CCTCTTTTAC CCCAGTAATT ACATTGAAAA TGATTAGTTA CTAACGTCTC TGCATTCCAA 300 

TGAAGTGGTA TTGGATTTTC TTGCGCCTTC ACATACATTA CTACTGCTGG ATCCCCGAAA 360 

ATAATTCTGT CAACTCGTAT TTCATGTAAA AAATTAATAT AATCTTCTAC AGCATCTAAA 420 

TGATAATTAT GAAATAATCC ATTCACTGCC GCATATACTT TTTTATCGTT TTTGTGAGCT 480 

AATGCGACAG CCTCTGTCAT TTGTTGTCTA TTGAATTCCC CTGGAAGTCT TAAACCAAAC 540 

TTTTGCTCGC CAATTACAAA AGCATCTGCA CCTAAATCAA TAAGTGTTTC CATATGGCTT 600 

AATGACTTGG GTGTGACAAG TAATTCTGTC ATAGTCATTC TCCTTTAATT GAAATCGCTA 660 

ATCCATCGTC TATATTTAAA AAATTCGTTG TATATCCTGG TTGCTTTATT AACCACTCAT 720 

TATAATCTTG AACCTTTTTA ACCATTTGTC TTACATTTCT CGATCTAACA ATCCCAATAT 780 

CCGATACAAA ACCGTGATAT AAAACATTAT CTGTAATTAC GAGACCTTGG TGCTTTAAAA 840 

SO GTGGTGTATA TATTTCAAAA AATTTCTTTG ATTGCGCTTT TGCTGCATCA ATAAATATCA 900 

TATCATAAAC TTTGTCATTT ACATTTTCAA ATTGCTCTAA AGCATTACCT TCAATAATTC 960 
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CATTACGCTC TATCGTTGTG ACATGAATGT CATCAGATAT AGAAGCGAAT TGCATAGAAC 1080 

TATAGCCGAT TGCTGTACCA ATTTCTAAAA TATTTTTAAC ATTATTCATA CGAATTAATT 114 0 

GCTTAATTAA ATCTAATGTT AAACGATCTA CAATTGGCAC TTCATTTACC TCGGCAAATT 1200 

CACGCAAAAC TTCGATTGAA CTATTTTGAT GTTGATGTAA ATCTATTAAA TATTTTTTAT 12 50 

TTAGGTCATC CATGTTTTAA ACTTCCTTTA TGTAAAATAA GTCAATATGA TTATGACAAT 1320 

AAAATAAATC AGCCTTCACA ATTGATTATA ATTTTGCCAA CCAATTAAAT GACTGATTTC 1380 

GTGTTAGACG CAAAGCTATT TTATTTATAG AAGCGAATCA TTCATATAAA ATTTAACTTT 1440 

AGATATTTTA CCATATTTTC AATAAAATTA TAAGCGTTAA TTATTTATAC ATTGCTTGAC 1500 

TTAAAAAATA CTCTTGCCTC CCCATCTTTA AGGTTAGCAA GAGTAAAATC TTTTTAATTA 1560 

TTCTTCCATT TCAGTATTTA CAACTTCTTC AATCATGTCC CATTCTTCAT CAGTTTCGAT 1620 

TGGTACTAAC TTACCACCGT CACCTGACTC ATCTGGTTCA TTGATCATTG GTACAAGCTC 1680 

AATCATATCG TCTTCATCTG ATTGAGCACC TTCTTCAGCT AAGATAACAT ACTCTTTTTT 174 0 

GAATTCAGGA TGATAAAATT CTAAAACTTT TCGGTATAAA ACTTCATTTC CCTCTTCATC 1800 

2S GAATAAAGTT AATAATTCTT CTTCGTTATT AATTTCTAGT TGTGAATCAT GATTATGTTC 1860 

AGTCATAGTA AAATCTCCTT TTAATGTAGT GAATCTAAAT AGCCTTGTAA AATAAATACC 1920 

GCTGCCATTT TATCAATCAC TTGTTTTCTT TTTTGTCTTG AAACATCTGC TTCTAATAAT 1980 

30 GATCGTTCAG CAGCCATTGT GCTTAATCTT TCATCCCACA TCACAATCTC AATAGAAGGA 204 0 

TAAGCTTCTA ATAATTTTTC TTTATATGTT AACGAAGCTT CGCCTCGAAA TCCTATTGAA 2100 

TTATTCATGT TTTTAGGTAG TCCTATTACG ACTGTACCCA CATTATGTTT TTTAATAATG 2160 

TCTACTAATT GGTCAATACC TAATTCATTA TTTTCTTCAT TGATTCGGAG TGTGTCTAAT 2220 

CCTTSTGCCG TCCAACCCAT TATATCACTA ATTGCAATTC CTACCGTTCT ACTACCGACA 2280 

TCGAGTCCTA AAATTTTATG TTGTAACATA AATTATTTAT TTTGCTCTTT TAAATAGTAA 2340 

GAAACAAGCT CTTCCATAAT AACATCTCTA TCAATATGAC GAATTTGATT TCTTGCTTCA 2400 

TTTTGGCGTG GAATATACGC AGGGTCACCT GATAATAAAT AACCTACAAT TTGGTTTACG 2460 

GCATTATATC CTCGTTCATC TAATGTTCGA TAAACATTAT TTAAAACATC TCTTACATCT 2520 

TGCGTTGGAA GTTCTTCATA GTCGAATTTC ATTGTTTTAT CAAAGTTTTC CATTTGCGAC 2580 

ACTCCTTTAA TTACAAATAT AACTCACTAT CATCATACAA TATTATGGCT TTAAATTATA 2640 

50 GATTTTTAAT GTAATCTTTA ATAAAGCTTA ATGATTTTGA GATATTTTCA GGTTGTGTAC 2700 

CGCCACCTTG AGCCATATCT GGACGACCGC CACCTTTACC ACCAACGATT GGTGCCATTT 2760 
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TCGATACTTT ATCATCAACA TTACTTGCAA GAATGATAAT TGTATCTTGT AGTTTAGATT 2880 

TAAAATCGTC CATTGTCGAG CGAATTGCTT TCGCATTTGG TACATCCACT TCAGTAACCA 2 940 

ATACTTTATA GCCATTGATT TCTTCAACTT GATCTTCAAT ATTACCCATT TTAAGTGATG 3000 

TGATTTCTTT GTCACGTTGC TCTAATTGTT TTAATAATGC TTTTTCTTCA TCTTGTAATT 3060 

GTGTTAACTT ATCGACTACT TGATCATCAG ATTTCACTTT CAGCTGTGAT TTCATCGTAT 3120 

TAAATTTCTC TTGAATATCT TCTAAATATA AGAAAGCTGC TTTACCTGTT AATGCTTCAA 3180 

TACGACGCAC ACCAGCTCCT GTACCTGACT CACTTACTAT TTTGAATAAG CCAATTTCAG 3240 

AAGTATTGCG GACATGAATA CCACCACATA ATTCAATTGA AAATGGTGCC ATATTTACTA 3300 

CACGCACAAC ATCACCATAT TTTTCACCGA ATAATGCCAT TGCGCCCATT TCTTTAGcTG 3360 

AAGCAATATC CATTTCTTGA ATGTTAACGT CAATACCTTT CCAAATTTCT TCATTTACTA 3420 

AGCGTTCAAC TTGATCAATT TCATCATTAG TCATTGGACC AAAATGAGAG AAATCAAAAC 3480 

GTAAACGATC TGCTTCTACT AGTGAACCAG CTTGGTTAAC ATGATCACCC AGTACTGATT 3540 

TCAACGCTGC ATGTAATAAA TGTGTTGCAC TATGGTTCTT TTGAATGTCA CGTCGATCAT 3600 

TTTGGTTCAC TTCAGCAGAC ACTGTAGCGC CAACATTTAC TTGGCCAAAT TGTACTACTC 3650 

CTTTATGCAA GTTTTGACCA TTTGGTGCTT TGGTTACTTC ACTAACAGCA ATTTCAAAAT 3720 

TGTCATTATA AACAATACCT GTATCCGCAA CTTGTCCACC ACTGATTGCA TAAAATGGTG 3780 

30 TTTCCGTTAA CATGAAGTAT ACTGTTTCAC CCGCTTCAAC TTGTGAAACT TCTTCACCAT 3840 

TGTATATCAA GTGTGTTAGT GTTGTTTGAG ctGTCGCAGT AT CAT AA CCA ACAAAAGTAC 3 900 

TTGCAGATGT AATATTTTTC AATACTTCAC TTTGAACTTG CATTGATTGA GAATTTTGAC 3960 

35 GTGCTTGACG TGCACGATCA CGTTGTTGTT GCATTTCTGA CTCGAATGTT GTCATATCAA 4020 

CTTCCAATCC TGCTTGCACT GCTATTTCTT CAGTTAATTC AATTGGGAAC CCATACGTAT 4080 

CATACAATTT AAATGCATCT TTCCCATTAA TTTCATTTGT TGTCGCTTTA GCTTTTTTAA 4140 

TTAATTCATT TAAAATCGCT AAACCATCTT CTAATGTTTC ATGGAATCGT TCTTCTTCAG 4200 

ACTTTATAAC ACGCTTAATG AAATCTGCTT TTTCCTTAAC ATTTGGATAA TATGGTTCCA 4260 

TAATGTCTGC AACAATATCA ACAAGTTTGT ACATAAATGG CTCATTGATT CCTAACGTTT 4320 

GACTAAAACG AACGGCACGA CGTAACAATC GACGTAATAC ATACCCTCTA CCTTCATTGG 4380 

CAGGTAATGC ACCATCAGAA ATTGCAAATG CAATCGTACG AATGTGGTCA GCAATTACTT 4440 

TAAATGCCAC ATCTTGTTCG TTGTTTACTA AATATTGTTT ACCTGATACT TTTTCGATTT 4500 

CATTCATTAT AGGCATAAAT AAATCTGTTT CATAGTTAGT ACGTACATTT TGAGAAACTG 4560 
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TATGATCTTT 


ATTATGATTG 


AATTCACTAA 


ATACTAAGTT 


CCATACTTCA 


AGATAGCGTT 


4680 




CATTTTCTCC 


ACCTGGATAC 


ATTTCTTCTG 


CCGGATCGTC 


TTGTCCATAT 


GCTTCTCCGC 


4740 


5 


GATCATAGAA AATCTCAGTG 


TTCGGTCCTG 


AAGGCCCTTC 


ACCAATATCC 


CAGAAGTTAC 


. 4800 




CTTCAATGCG 


AATAATACGA 


CTTTCTTCAA 


GCCCAATATC 


TTTATGCCAA ATGTTGTATG 


4860 


10 


CTTCCATATC 


TTCCGGATGA 


ATCGTAACGT 


ACAATTTATC 


TGGCTCCATA 


CCCATCCATT 


4920 


TATCACTCGT 


TAAAAATTCC 


CAAGCAAATT 


CAATCGCTTC 


TTGTTTAAAA 


TAATCACCAA 


4980 




TTGAGAAGTT 


ACCTAACATT 


TCAAAGAATG 


TATGGTGACG 


CGCTGTGAAA 


CCAACATTTT 


5040 


15 


CAATATCATT 


TGTACGAATA 


GCTTTTTGAG 


AGTTTACAAT 


TCTTGGCTTT 


TTAGGTGTTt 


5100 


CACGTCCATC 


AJCk A AT ATTTP 
rvwiin a x x v« 


TTTAATGTTG 


CTACACCTGA ATTAATCCAT 


AATAATGTAT 


5160 




CATCATCAAT 




GGTGCAGAAG 


GTTCAACCAT ATGTCCTTTT TCAACAAAGA 


5220 


20 


AATCTAGATA 


X 1 X X IVJlClA 


ATTTCACTCG 


CTTTTAACTT 


TTTCATCATT 


TACACATCCT 


5280 




ATTTACTGTT 

AAA A VJ A X 


TTTAAATTir 


CATTCCATAA 


AAATTGATGA 


CACAGATAGT 


CGATTTGCAA 


5340 




AACTAGTATA 


AATCAATATC 


ATTTTTTATT 


ATTAAAAAAT 


AAAAAACGCC 


CATCCTCAAA 


5400 


25 


AGGGACGAAC 


GTTATCGCGG 


TACCACCCTA 


GTTATAAATG 


CAATTCAACA 


CATTTATCAC 


5460 




TTTAATTCGA 


CTATACAGTT 


GTGCATAAAG 


TAGCGTTCAC 


TAATGTTTGT 


tGTACTTTTC 


5520 




ACCAACCAGT 


ACATCTCTGA 


TAAACAAATC 


aTTAACTACT 


CATCTTTATA 


CGAATTTAAT 


5580 


OKI 


TCTATTTTAG 


TTACATTTAC 


GCTTGTTGTC 


AACGTTCTAT 


AAAGTCATAC 


GGCGTGATTT 


5640 




CTCCCATATT 


AATCATTGGG 


TCAATTTTAA ACATTGTAGC 


TTCCGTTAAT 


ACATTTGTAT 


5700 




CTGTTTTTGT 


TGAATCAGAC 


ATAACTTCTT 


CACTATCATT 


CGATGACATT 


GGCGCTTCTA 


5760 


35 


CTTGATCATC 


TATTGTCGTT 


TGTGAAGCTC 


CTGTATCATT AgTTGCTGTG TTTTCCAgCA 


5820 




tttcStcatc TTCTGAATTA aaataatttt 


TCAACAATGT 


ACATAATTGT 


GTTAAACGCG 


5880 


40 


CTTGACCATT 


TGTTTTCAAT 


CCAATATCAA 


ATGCTTCCGG 


ATCACCAAGT AAAACTAAAC 


5940 


TCGTTTTCGC 


TCTAGTTAAA 


CCAGTATATA 


ATATCGGTCT 


TTGTAACATT 


CTAAAATACT 


6000 




GTTTAACAAT 


AGGCATGATA 


ACAATAGGAA 


ATTCTGAACC 


TTGTGATTTA 


TGGATTGATG 


6060 


45 


TACAATAAGC 


ATGTGTTAAT 


TCCATCATAT 


CTTGTTTCGT 


AAATGTAATT 


TCATTACCTT 


6120 




CAAAATCCAC 


AACAAGTACA 


TCTTTATTAA 


GGGCATTTTC 


TTTCGCCCAA 


AAAATACCAA 


6180 




CAATAACTCC 


TATGTCACCA 


TTGAATATGT 


TATCATTTGG 


CCTATTAACA 


AGTTGTAATA 


6240 


SO 


CTTTGTCACC 


TTTTCTAAAG 


ACTACATCAC 


CAAACTCAAT 


TTCTCGTGTG 


TCTTTCTTTT 


6300 




TAGGGTTTAA AATATCTTGT AAAACTTGAT TTAAACGTTT AATACCGGCA 


TTTCCTTTAT 


6360 
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CTACCTTCTC AACAACTGTT GGTATTTGGT TTGCCTGACA GTTAATAAAA CTTCTATCAT 64 80 

GAAAACGCTG TGTAATATCA ATTTTCTGAC CCAACTTCAT TCGATGTGCT AATTCTATAA 6540 

TGCTTGAACC ATCTTGTTGA CGATATACTT CAGTCAGATT TACTCGTGGT ATAGCTTTCG 6600 

ATTCAATTAA ATCTTTAAAT ACTTGACCAG GACCTACAGA AGGCAATTGG TCCTCATCAC 6660 

CTACAAATAT CAATTGTGCA TCTAAAGGAA CTGCACTTAA AAATTGGTGG AACAACCAAG 6720 

TATCTACCAT AGACATCTCA TCAATGATTA TGAGTCGTGC GTTTATTTCA TTTTCTAATA 6780 

TATCCTCTGG CTTTGTGTCT TGATTCCAAC CTATTAAACG ATGAATCGTC ATTGCTTCTA 684 0 

ATCCAGTTGA CTCTTGTAGT CTCTTAGACG CTCTTCCTGT TGGCGCTGCT AATACAACTG 6900 

GATAATCATC ATTGACATAA TCATCATAAT CTAATGATAA GCCATGAATC TCAGCATATA 6960 

ATTCAACAAT ACCTTTAATT ACTGTCGTTT TTCCTGTTCC CGGTCCACCG GTTAATAGCA 7020 

TCACCTTAGA ATTGATAGCC GTTTGCAAAG CTTCTTTTTG TGAAGCTGCA TAGTTCACTT 7080 

GATTCGCATC TTCTATTTCA CCAATATGCA TTTGTAAATC TGACTGTTCA ATTTCTGTAA . 7140 

GTTTATTTGT ATGCGTCTTT ATTCTGAATA AGTTTTGAAC ACTTTTGATT TCaGAATAAT 7200 

2S ■ ACAAACTTGG AATTGCAACT TGTTCaTTGT CAATAATTAG TCGTTTTTCC TCATTTAAGT 7260 

ATTGCAACAT TTCGTCTAAT TTTTCAGGTT CGATGACCTC TTCATCTTGa TAATTTAATA 7320 

CATCAACCGT TAAATCTATA ACAACATTGA TAGGCAAATA TGTATGTCCC TGTTTAATAC 7380 

30 ATTCTTCTTC TAACGTATAG AGCAACGCAG CTTTTAATCG TTCATTATCG TTATAAGCGA 7440 

TACCAATATT TCTAGCAAGT TGATCTGCTT TATTAAAACC AATACCTTTA ATATCATAAA 7500 

TCAATTGATA TGGATTTCGA TCTAAAATAG TCAGTGTATC GCCGAGATAA AACTGATAAA 7560 

TTGCCATTGA AAGTTTAGGA CCAAACCCTA AATCATGTAA ACGAATCATT ATTTTTTCAG 7620 

ATTCTTGATT TGCTGAAATT TGTTCTGCAA TTTGTTTCTG TTTCTTTTTA GATAATCCCG 7680 

AAACTTTTTC TAGCACTGAA TGGTCATCTA ATATATCATT TATCGCATTG TCACCTAATG 774 0 

TATTAACAAT ATTTTGAGCT GTCTTTTTAC CTACACCTTT AAACAAATCA CTAGATAAAT 7800 

AACTTATAAT TGCTTCTTTC GTTTGTGGCA TTTCTTTTTC AAAAGTCTCT GCTTTTAATT 7860 

GTTTACCATA ACGTGGATGA TCAACAACTT GCCCTTTAAA TGTGTAGACA TCGCCTTCAA 7920 

CAATATTCGG AAGAAACCCT ACAACAGTTG GCATTGTATC AAAGTCTTCA TTTGTTTCAA 7980 

TAGTATCTAC TTTAAGCACT GTATAAAAAT TATCACTGTT TTGAAACAAT ATCGCTTCAA 8040 

CAGTACCTTT GATCATTGAA TAATCAAATA GTGTAGGGTC TGACATGTTA CTCCTCCTCT 8100 

TTCATTTTAG TGAATGTTTT CAGCGCATGC TGACTTAATA AGTGTTTAGG GTCGATAGTC 8160 
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AAGCCCAAAT 


TGTATCTTGC 


ATCAACATGA 


TTTTTATCAA 


TCGTTAATAC 


ATGTTTAAGT 


8280 




TGAGTTATGG 


CTTCATTAAA 


CATTTCTAAT 


TGACATAATA 


CAAGACCATA 


TTGAAATTGA 


8340 


© 


ACTTCTGCAT 


CTTTGTCTTT 


ATCTAGTTCC 


GCAGCAGTCA 


TTAAATACGG 


CAATGCCAAG 


8400 




CTTAAATGAT 


TCTAACTGAT 


TAAACGCCAT 


ACCGATCATA 


TAATTACAAT 


CAACTTGTTC 


8460 


10 


AATCTCTGTT 


TGTAATGCTT 


GTTGATATAA 


TTTAATAGCT 


TCTTGATAAC 


GTTGCTGATT 


8520 


ATAATATACA TTTGCTAGAT 


TAAAAAATAC 


GACGCCATTC 


TTCGGATCTA 


TTGTnAAAGC 


8580 




TTTTTGGAAA AAACGCTCTG CCTTTyCAAy CyCATTCgCA TCAGCAAGTA 


CGATmCCaGC 


8640 


1S 


ATTAATATAA 


TTTTCAATAA 


TTGTAGGATT 


TTCTTCGATA 


TTTCCGAACA 


ATGCTTGTAA 


8700 


CGCTTCTTCT 


ATTTTTCCAT 


TTTGTATGTA 


TTGATAAATT 


GTTTGTTGAT 


CTATCATTTA 


8760 




CGAACCTCAT 


TTCTCATCAA 


TTATAACATC 


TTGATAAATT 


GTATGTCTCG 


AATCACTTAA 


8820 


20 


CAACGAATAA 


AATATAATCT AATATCATCT 


TCATTCATGA 


AAAAGCGGGA 


ATGGAATAGA 


8880 




AATGCTTAAG 


AACCATTAAC 


GGTTTATTAT 


GTAATGGTTC 


TTCCACATTA 


GCCACCACTA 


8940 




TTATGTACTT 


AAAAATAAGA 


ATACATAATT 


AGATTCATGC 


ATAGGGAGTG 


GGACAGAAAT 


9000 


25 


GATATTTTAA 


CAAAATTAAA 


TTCGTTATCC 


CCAACTGGCA 


TTGCCTGTAG 


AATTTCTTTA 


9060 




CGAAATTCTC 


TATGTTGTGG 


TCCCGCCAAT 


ATAACATTGT 


AGAGCCTAGG 


ACATTGTGAT 


9120 




GTCCCAGACT 


CTATCCTCAT 


GAATTATTCT 


CATCAAAAAC 


TGTCTTTCGT 


CATTTTCAAC 


9180 


30 


GTTGAAACTT 


CAAATAAGTA 


ATTTATTGTT 


GCCATTGTTT 


ATACAACATA 


ATTTAATTGA 


9240 




CCTTCATTTT 


TGAACACATC 


GTCAATTGTT 


GCACCACCAA 


GACACACATC 


ACCTTGATAA 


9300 




AAAACAACTG 


CTTGTCCAGG 


TGTGATTGCT 


CTTACTGGCT 


CAGCAAAAGT 


AACACGTAGg 


9360 


35 


CAtGGtCGTT 


TTCACGTTTC 


ACAAAAACTT 


TCGTATCTTT 


TTGGCGATAT 


CTAAATTTAG 


9420 




CTGtACATTC 


AAAACCTTGA 


TCTAAGTCAT 


TATCTTCTGG 


ATTTACAAAT 


GAATAGTCTG 


9480 


40 


AAGCAATTAA 


GTAATCACTG 


TATAATGCAT 


CGTGATGGAA 


TCCTTGTTCT 


ACATATAAAA 


9540 


CATTATCTTT 


TAGGTTTTTA 


CCGACAACAA 


ACCAAGGATC 


GCCATCTCCA 


CCTATACCTA 


9600 




ATCCATGTCT 


TTGTCCTATT 


GTGTAATACA 


TCAAACCACT 


ATGTTTACCC 


ATTTTCTTAC 


9660 


45 


CATCAAGTGT 


TATCATATCA 


CCCGGTTGTG 


CAGGTAAATA 


TTGTGATAAA 


AATGTTTTAA 


9720 




AGTTTTTTTC 


GCCGATAAAA 


CAAATGCGTG 


TAGAATCTTT 


TTTCTTAGCA 


GTAACAAGTC 


9780 




CTTGTTCTTC 


AGCAATTCGA 


CGCACTTCAC 


TCTTTTCGAT 


GTCGCCAATT 


GGGaACATCA 


9640 


50 


CTTTTGAAAG 


TTGTTGTTGA 


GATAATTGAT 


TCAAGAAGTA 


TGTTTGATCT 


TTATTATTAT 


9900 




. CTACACCACG 


TAACATTTCA 


ACATGACCAT 


CTTCATGACG 


ATGTATGCGT 


GCGTAATGTC 


9960 
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TTTCTTTATT 
AATACGTAAA 
CAATTTGATT 
TTTCGTCAGT 
TTAAGACGTG 
TATCTTTATT 
CTACAATTGC 
GATTTGATCG 
CTGCTGTACA 
TCGTTTCAAC 
TTGAACCATT 
TTAAATTCAT 
TAGCCATCCC 
CACCGCCAAG 
CTTTTGGTCC 
ACTTAACATC 
CAGCAATAAT 
ACATraTAGa 
TAGCACCTGT 
CAAAAACATG 
GTTC2LTTTGC 
TAAATATAAT 
CTAAATATTT 
AATTGTAAAT 
AATCTGCATA 
GCACCTTACA 
TATTTTACCA 
TTGTCTTTTT 
CTATTATTTT 



ACACATAACG 
GACTTTATCC 
ACACACTTCA 
GTCATCCCAG 
GGCTGTTACA 
TGACAATTAT 
ATTAATTTCA 
CTCCTCATCT 
TGCAGATCCA 
TTCAACAAAC 
TAATTCAAAT 
TAAATGAATA 
AACAATTTGC 
TTGAGGATAA 
GCCAAACTTA 
AAGATGTCCA 
ATCTTGAATA 
TACTAAAATC 
ATCATCAACA 
TAACACAGAA 
TTTTACTATG 
TTCATGTGTA 
ACGCGCATCT 
CGTCATCATC 
AATTTCCATG 
TACTATTTTT 
TTTTCTACAC 
TATAAATTTT 
GGTTATGAGC 



TCTGGATTTG 
CAATATTCTT 
ATAACATCGT 
TTTTTCATAA 
GAACTATCTA 
GACTCCTCCT 
TTTTCAGTAG 
TCGAACATTG 
GACGACACAT 
GGAAAATATA 
GGAATCGCTC 
TTGTTATCGT 
GCAAGATTTT 
TCTAGTGTAA 
TGAGCAGTAA 
ATTGCTTGAA 
TCATAAATTT 
GTCTTATCTG 
TCTAGATATG 
TGATGTTCAA 
CCTTTAATTG 
TCTGCACCAA 
CTTCCCTTAG 
GCATCTACTA 
TTTGGACACT 
CTACTTTTCT 
ATGCTTTTCG 
AGTATTTGCA 
AATTTAATAT 



GAGTACGACC 
TTTCAAAATT 
TGTAATCTTC 
ATATGCCAAT 
CACCGCCTGA 
TAAATTTAAA 
TCAATTCGTT 
CATCTAAAAC 
AGATTTGTGC 
GATTTACAAT 
TTTCTTGTAA 
CTCGATTCTT 
CAGTGCCTGC 
CATGGTCTTT 
TACTCATTGC 
CCGCATCAAC 
GTtGCACTGT 
tAATTGTTTC 
TTACATCAAA 
TCTTCGATGT 
CCGTATTATT 
GTAATTGTGC 
CATGTATTGA 
CTTCAGGTTT 
CCTCACAATT 
GTTTAACTTT 
ATAGGCTTTT 
GATATTTTTT 
TTATCTGGTT 



TTTTTTGTAT 
AACAGCGTAA 
AGTTGCAGTA 
GACATCATAA 
CATACCAACG 
ATATATTTTA 
AAAACTAAAT 
ATGCGACGGT 
CATATCCAAC 
ATGGCCTGTA 
TTTAACTAAA 
TTCTGCTAAT 
ACGGCGTTTC 
AACTAGTAAT 
GTCGATCTCA 
ATGGAAATAT 
GCCAaCTTCA 
TTCAAGTTGA 
ACCTTCTCGC 
GATAATGTGA 
CGATTCTGTT 
AATTTGACGT 
TGATGGATTA 
TACTGGTGTG 
TTATCAATGT 
ATTTATAATG 
TTAAGTTTAT 
TATTTGTAAA 
ATTCGATTGG 



TCATCTAAGA 
TACGGAATGC 
CATACGCCAT 
CCTTGTTCTT 
ACAACACGTA 
TGAATTTCAG 
CGAATCGAAT 
TGTGTAGAGC 
AATGTTAACA 
GCATCCGTCA 
AATTGTTCTT 
TGTAATGCTT 
AATTCTTGTT 
GCACCGACAC 
AATTCGTCAA 
GCATTTGTCT 
TTATTTACAA 
TCTAAATCAA 
TCTAATTGTT 
TTACCCAATT 
GCGCCACTCG 
CTTGACTCAT 
CCATAATGCG 
GTCGCAGCAT 
TCCAATAATA 
TTTTTAATTA 
CGCTTTATTC 
ATGTAACGTA 
TATACTTCTT 



10080 
10140 
10200 
10260 
10320 
10380 
10440 
10500 
10560 
10620 
10680 
10740 
10800 
10860 
10920 
10980 
11040 
11100 
11160 
11220 
11280 
11340 
11400 
11460 
11520 
11580 
11640 
11700 
11760 
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GTCCCTATTC 
CAACATTTAG 
AACCTAGTAA 
ATACGTGTAG 
CAATTTGGCA 
CCTGGAACAG 
AAATTTCCAG 
TATGTTCGTG 
ACAGATTCTG 
GCACCTCAAC 
GTATTAGACG 
GAAGCACAAT 
ATGCAGCCCG 
GCGATGGCTA 
AAAATTCAAG 
ATTTATGATA 
ATAAATGAAA 
ATATTAATAA 
ATTTATTTTA 
TTCAcTTTAC 
ATCCSAAATT 
TCGATCCTGT 
TTTTAAATTT 
TATATTTGAT 
GTTTTTAGCA 
TTTTTCTAAT 
TTGATCGAAC 
CCACTAAGGA 
ATACGATTAA 



GAGAAGGTGA 
ACGAATTATC 
GTTCAGCAAC 
GTTCTGGAGG 
CGATGGCAAC 
ATATGATGAC 
AAGAGGTTTC 
CTTATCCAGC 
CACATTTAGC 
AAATGAAAGA 
AACCTTATGT 
ATTTAGCTTC 
TTCAACCGCC 
TGGAAAGACA 
ATTTTATGGA 
AAGATATGCA 
AAAACACTTT 
AAATATACAG 
GTAATGATTC 
ACTGTGTAAG 
TAAAGAAATT 
ATATTCATTT 
TTCTACGCGT 
TAGTTTAATT 
TTTTCAACAA 
TCTTTGTTAT 
TtACTTTCGT 
GGTTCGCTmm 
ATATAAAACA 



AGATGAACAA 
ATATGAAAGA 
TGCTTTATTA 
CATCATGTTA 
ATTATTTCCA 
CGcAAGTGCA 
ATTATTACAA 
AGTAGGTAAA 
TGCTCGCAAA 
AGCTATCGAA 
TATTGTATGT 
ATCTATGGCA 
AACACATGAA 
GAAAATATCA 
AACTTATGGT 
ATTAGACTCT 
ATAATGTGAT 
TAACAGCATT 
AAATTCACTT 
TGTTTATTTG 
TATTTCTCTT 
ATCTTATCTT 
CTTTAGCTTT 
GAACTTATTT 
CTTCTTTTGC 
CAGTAACGTT 
CTGCCATAGT 
mCAyymyAAT 
TGTATCCGTC 



ACAGCAATTA 
TATTGGATTG 
ATTCAACATA 
CCTAATCATG 
AATCGTGTCG 
TTAAGACGAG 
CAATATTTCG 
AATGTGCCTT 
GGGCTTCCAT 
ATTTACAAAA 
TTAAATACAA 
CAAGTAATGG 
CTACAAAATA 
TTAATAGGTT 
GAAGTCAACG 
TATCGTCGGT 
AAATAAACTA 
TTGAATGAAA 
AAAATyCTAA 
ATGGGGCGCT 
TATCTTCATT 
TTACATTTTT 
ATCCATAAAA 
TTTAAGTTTA 
TTTaCCAGTC 
ACCTACTGTT 
GAAACCTCCT 
ATGAAGTTTT 
TAAATCTTCA 



ATAATATGGT 
CTGAACACCA 
CGTTAGAACA 
CTCCATTAAT 
ATTTAGGATT 
ATCAACATGA 
GCCCTGCTCA 
TATACATTCT 
ATGTGTTCGC 
CGTTATTTGA 
TCGTTGCTGA 
TTAGTATCAC 
TATTAACGCC 
CAGAAAATAC 
AAATTATGGC 
TCAAGAATGT 
AGTGAAAGTA 
GATGTCTTTA 
tGCAAATATG 
TTCAAAATAT 
TTCTTTTTTC 
AACTTGTTCA 
CTCATATTAA 
TCAATTGCAT 
GCTTTATCTT 
TCTTTAACAT 
TGGATGTATA 
TATGTTATAG 
CTTGTATCTA 



TAATCTCGCA 
TAACGCTCCC 
TACGAAACAC 
CGTTGCGGAA 
AGGACGTGCA 
TGGTGTTTAT 
CCAACAAGCA 
TGGTTCTTCA 
TGGACATTTT 
ACCTTCTGAT 
AAATGATGAC 
TCGTGGCAGA 
GAGAGAATAC 
TGTTCAACAA 
AATAAGTTAT 
TATAAATCAG 
TGTATCCATA 
TTGTTCAATC 
AAAGCGCCCC 
TGAAAAGCAT 
TCTTCGTTAT 
TTATCGCTAT 
TCGCTCCTCT 
CAGTTATTTT 
GCTGACCTTC 
TTCCTTTAAA 
TATTTATATA 
TATAGTATTT 
CATATTCCGC 



11880 
11940 
12000 
12060 
12120 
12180 
12240 
12300 
12360 
12420 
12480 
12540 
12600 
12660 
12720 
12780 
12840 
12900 
12960 
13020 
13080 
13140 
13200 
13260 
13320 
13380 
13440 
13500 
13560 
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TAGTTGTTTT TGCGCAGGTG GTTCTGATTC AATACTTTCA ACAAATGTAA TTGGACCTTC 13680 
TAACAGTCTT ATAATATCCC CTGCTGAGAT TTCTT 13715 
5 (2) INFORMATION FOR SEQ ID NO: 196: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 873 base pairs 

(B) TYPE: nucleic acid 

W (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



15 



20 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 196: 

AAATCCATAA TGTCATGATA ATCTGCATAT GCTTCATATA ATTCAATCAT TGTGAATTCA 60 

GGGTTATGTC TAGTTGATAC ACCTTCATTA CGGAATACTC TACCAATTTC ATATACTTTT 120 

TCAAGTCCAC CGACAATTAm ACGTTTTAAA TGCAACyCAA TAGCAATACG CATGTATAaC 180 

GTTGCATCTA ATGCATTATG ATGTGTTACA AATGGTCTAG CAGCTGCTCC ACCAGCAATT 240 

TGGTGCATCA TAGGTGTTTC TACTTCCAAG AAACCTTTAT TATTTAAATA ATTACGCATT 300 

25 TCTTGAATGA TTTTACTACG ATTAATAAAT GTACGAGTGC TATCTTCGTT CGTAATTAAA 360 

TCTAAATATC TTTGACGATA tCTCTGTTCA ATATCCTGTA AACCGTGGAA TTTATCCGGT 420 

AATGGTCGCA ATGATTTAGT TAGTAGCGTG AATTTCTTCG CTTTAACCGA TAATTCGCCA 480 

GTATTTGTTT TGAACATTAC ACCTTCAACA CCAACGATAT CGCCTAAATC AGCATTTTTC 540 

CATAAATCAA ATTCGTCATC GCCAACTTGA TCTTTACGAA CGTAAATTTG AATTTGTCCA 600 

GCTAAGTCCT GAACGTGTGC AAATCCTGCT TTACCTTTAC CACGCTTAGT CATTAATCGT 660 

CCAGCTATAG CGACATGACT ATCCGCTTCT TTTTCTACCA ATT CTT CTTT AGAATACTGG 720 

TCCeACTCTT CTTTCAAATC ACTAGATAAA CCTGAACGGT CAAATTTAGA ACCAAACGGG 780 

TCTATACCAA GATCATATAA TTCTTGTAAT TtTTGACGTC GAACCAACAT TTGGTCATTC 840 

ATTTCTTCTG ACATAACTtT CTCTCCTTTA ACT 873 
(2) INFORMATION FOR SEQ ID NO: 197: 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 452 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 197: 
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ACCATAATAT 


GAATGGCTTC 


AGGATCAAAA TAAAGACCAA 


CTTCACTGCC 


TACTTCAGCT 


120 




TTTTTAGTCG 


TTTGTATTAC 


CCATTCATAA CCTTTATTGT 


CTATACAACA 


TATTTCATAG 


180 


5 


TGGACCCCTC 


TAAATAACAT 


AGAATCAACA GTTGCTTTAA 


ATAATCCTTC 


TTCAGCTTTG 


240 




ATTAATGATA 


TATCTTCTGG 


TCGAATAACG ACTTCTACTT 


TTTTATTTTC 


AGGAATACCC 


300 




ATATCGACAC 


ATTCGAAATC 


TTGCCCATAA ATATTCACGA 


CATAATCTCT 


AACCATGCGC 


360 


10 


CCTTCAACAA 


TATTAGATTC 


TCCAATAAAA TCAGCTACAA 


ATCGATTCAC 


TGGTTCGTCA 


420 




TaTATATCTG 


TTGGTGTGCC 


AAATTGTTGA AT 






452 


15 
20 


(2) INFORMATION FOR SEQ ID NO: 198: 








(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2308 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 










(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 198: 






25 


TAGGTTGGGT 


TCTAACATAC 


GATAAAGCTC AACAAATCAA 


CACAGCTTTC 


TTTGTAAAAT 


60 




TGTTTAATAC 


TGCATTAGCA 


GAACGTGATT ATTATTTTAA 


TATAGATGGA 


ACAAATGCTT 


120 




TTAGATTATT 


TAATGCTGAA 


GGTGATGGTG TTGGGGGATT 


AACAATCGAC 


AATTACGATG 


180 


30 


GTCATTTGTT 


GATTCAATGG 


TACTCAAAAG GTATTTATAA 


ATTTAAATAT 


GCCATTCTTG . 


240 




AAGCGGTTAG 


AAAAGTATTT 


GATTATAAAT CTATTTACGA 


AAAAGTAAGA 


TTTAAAGACA 


300 




GCGAATATAG 


TGGTGGTTTT 


GTTGAAGGAG ATGCACCTGa 


GTTTCCAATT 


GTTATCGAAG 


360 


35 


AAAACTTCAC 


ATTTTATAAT 


GTAGACCTTG AAGATGGTTT 


GATGACAGGT 


ATCTTTTTAG 


420 




ATOSfcAAAGA 


AGTGCGCAAG 


AaATTAAGGG ATCAATATGC 


CAAAGAACGC 


CATGTTTTAA 


480 


40 


ACTTATTTAG 


TTATACAGGT 


GCTTTTTCTG CAATAGCAGC 


AAGTGAGGCA 


TCTTCAACAA 


540 


CAAGTGTAGA 


TTTGGCTAAT 


CGTTCTCGTA GTTTAACTGA AGAAAATTTT 


GGATTAAATG 


600 




CTATTGATCC 


TAAATCCCAA TATATTTATG TCATGGACAC 


TTTTGATTTC 


TATAAATATG 


660 


45 


CTGCACGACA 


TGGACATAGT 


TATGACACGA TCGTGATTGA 


TCCACCTAGC 


TTTGCGCGTA 


720 




ACAAAAAACG 


TACATTTTCA 


GTGCAAAAAG ATTATGACAA ATTAATTAAT 


GGCGCCTTAA 


780 




ATATCTTATC 


ATCTGAAGGA 


ACATTATTGT TATGTACAAA CGCAAGTGTA 


TATCCATTAA • 


840 


50 


AGCAATTTAA 


AAATACTATT 


AAAAAGACGC TTGAAGAGAG TGGCGTTGAT 


TATGAATTAA 


900 




CTGAAGTTAT 


GGGATTACCA AAAGATTTTA AAACGCATCC ACATTATAAG 


CCATCTAAAT 


960 



55 



906 



EP0 786 519 A2 

TATTGAGAAA AAGAAGGGTG ATAATATTAT GGGATTCAAA AACAATTTAA CATCAAATTT 1080 

AACAAATAAA ATCGGTAATT CAGTCTTTAA AATAGAAAAT GTTGACGGAA AAGGTGCAAT 1140 

5 GCCAACGACG ATTCAAGAAT TGAGAGAAAG ACGACAACGT GCTGAAGCAA TTGTAAAGAG 1200 

AAAGTCTTTA ATGTCATCAA CAATGAGCGT TGTTCCAATT CCGGGTTTAG ATTTTGGTGT 1260 

TGATTTAAAA TTAATGAAAG ATATTATCGA AGATGTTAAT AAAATTTATG GTTTAGATCA 1320 

TAAGCAAGTT AATAGCCTTG GGGATGATGT GAAAGAAAGA ATTATGTCTG . CAGCAGCAAT 1380 

TCAAGGTAGT CAATTTATTG GTAAAAGAAT TTCAAATGCA TTTTTAAAAA TTGTAATTAG 1440 

AGATGTAGCT AAACGTACTG CTGCAAAACa AACAAAATGG TTTCCTGTTG TAGGACAAGC 1500 

15 

TGTGTCTGCA TCTATTAGTT ACTATTTTAT GAATAAAATT GGAAAAGATC ACATTCAAAA X560 

ATGCGAAAAT GTTATTAAAA ATGTCATGTA GGTGCTATAA TAGTTTTGCA ATTTGCAAAT 1620 

2Q TTTACTGAAA CCGGTTTTAA ACGAATTGAA TTTAAAGcAT GGTTTTGGTA AAGTTAATGT 1680 

ATAAAACTAA GTTAGyATTG TAATAATATk GAAGATTCTA ACTATACGAA GGAGAAATGT 1740 

AATTATGGAA CAAAATTCAT ATGTAATCAT CGACGAGAmT GGTATTCACG CTAGACCAGC 1800 

25 AACAATGTTA GTACAAACAG CTTCAAAATT CGATTCTGAT ATTCAATTAG AATATAACGG 1860 

TAAGAAAGTA AACTTAAAAT CAATCATGGG TGTTATGAGC CTTGGTGTTG GTAAAGATGC 1920 

TGAAATTACA ATTTATGCTG ACGGTAGTGA TGAATCTGAC GCCATTCAAG CAATCAGTGA 1980 

30 CGTCTTATCA AAAGAAGGAT TGACTAAATA ATCATGTCTA AATTAATTAA AGGTATTGCC 2040 

GCATCTGATG GTGTCGCAAT TGCTAAAGCT TATTTATTAG TTGAGCCAGA CTTAACATTC 2100 

GACAAAAATG AAAAAGTCAC TGATGTTGAA GGAGAAGTTG CAAAGTTCAA TAGCGCTATC 2160 

35 

GAAGCTTCTA AAGTTGAGTT AACTAAAATT AGAAATAATG CAGAGGTTCA ACTAGGTGCT 2220 

GATAAAGCTG CTATCTTTGA TGCAcaTTGG GGGGTGGTAG ATGACCCTGA ATTAATTCAA 2280 

CCAATCCAAG ATAAGATTAA AAATGAAA 2308 

40 

(2) INFORMATION FOR SEQ ID NO: 199: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5559 base pairs 
5 (B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

SO (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 199: 

AAGTAATAAA TCGTCTCATT TGGCAACTGA CGCATAATTT CTTTAGCTAC TGTCAAACCT 60 
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TTTAATTTTT AGTTTATCAT AACTAAGCAT TGGATTTTAG TATTATGCAC TGTGTTTACC 180 

ATTTTTGTCA TTATAATATT TATTTTAAAT CAGCCCACTA TCATATTGTC ATGTAATCTG 240 

CTTATTAAAA AAATCCCTTC CAAGTTATTG TGTATCTCCA TTCAATTTAA TTTTGAAAGG 300 

AACATAACwT TTTAACTCAA AAGGGATTAA TTTnTAnTCT ACTTCATGGT CTGAACCAAA 360 

GAATGATTTA AACATGTGGA ATGTTGTTTC TCTGTTCATT GCTGCAATGG ATGTTGTTAA 420 

TGGAATACCT TTAGGGCAAG CATTAACACA GTTTTGTGAA TTACCACACT GCTGTAAGCC 480 

ACCAGTACCC ATTAATGCAT TTAAAOGTTC ATCTTTAGTC ATAGATCCTG TTGGGTGCAA 540 

ATTAAACAAA CGAACTTGCG AGATTGCTTG TGCACCAACG AaTTTATTAT TTTCAGTAAC 600 

ATTAGGACAA ACCTCTAAAC ATACACCACA TGTCATACAT TTAGATAATT CATAAGCTGT 660 

TTGACGTTTT TTCTCTGGCA TACGTGGTCC CGGACCTAAA TCATACGTTC CATCAATTGG 720 

GATCCATGCT TTCATACGTT TTAAGTTATC GAACATTCTA GAACGATCAA CTTGTAAGTC 780 

ACGGATAACT GGGAAAGTAT TCATTGGCTC TAAACGAATA GGTTGTTCTA ATTGATCAAC 840 

AATCGCAGAA CAAGATTGTC TTGCACGACC ATTGATAACC ATAGAACATG CTCCACATAC 900 

25 TTCTTCTAAG CAGTTCATAT CCCAGACAAC AGGTGTTGTT TTTTCACCTT TAATATTAAC 960 

TGGGTTACGT CTAATTTCCA TTAAACAAGC AATGACGTTT AAATTTTCAC GATATGGAAT 1020 

TTCAAATGTT TCTTCATAAG GCTTAGAATC ACTTGTATCT TGTCGTTTAA TAATTAATTT 108 0 

30 TACTGTTTTT TGTTTCGGTT TAGATTGTGT TTCATGTTGT GGAGTGTTTT TCACTGATTG 1140 

TTCAGTCATT ATTTTTTACC CCCTTTAGAC TTACTTGTGT AATCACGTTT ACGAGGTGGT 1200 

ATTAAACTCA CATCGACGTC ATCATAAGTA AACTGCGGTT TTTCAAATGC GCCTTGGAAT 1260 

GAGGCCATTG TCGTTTTTAA CCACTCTTCA TCATTACGCT CTGGGAATTC TGGTTTATAA 1320 

TGGGCACCGC GTGATTCGTT ACGGTTATAT GCACCAATCG TAATAACACG TGCAAGTACT 1380 

AACATGTTCC ATAGTTGACG GGTAAAGAAT ACCGCTTGGT TACTCCAAGT TTGAGTATCT 1440 

TCCATATCAA TATCTTCATA ACGTTTCATC AATTCAACAA TCTTTTTATC TGTTTCTAAC 1500 

AGTTTTTCAT TTTCACGAAC AACAGTTACA TTTGCTGTCA TAATTTCACC AAGTTCACGG 1560 

TGTAATTTAT ATGCATTTTC TGTACCGCGC ATAGCTAATA ATTTATCAAA ACGTTCTTGC 1620 

TCTTCAGCTT TACGCTTTTC AAAAATACTT TCGTCCATAT CAGTATATGA TCGATCAATA 1680 

TTTGAAATAT AATCAATCGC GTTTGGACCT GCTACTGTAC CACCATAAAT CGCTGATAAC 174 0 

so AATGAATTGG CACCTAAGCG GTTACCACCA TGTTGAGAGA AGTCACATTC TCCAGCTGCA 1800 

AATAACCCTT TAATATTTGT CATTTGATCA TAATCTACAT ATAGACCACC CATTGAATAG 1860 
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TAAATCTCAA TGATACCACC TAGTTTTACA TCTAACTCAT GTGGATCTTT ATGTGACAAA 1980 

TCAAGATATA CCATGTTTTC GCCATTTATA CCTAATTTTT GGTTAATACA TACATCGAAA 2040 

ATTTCACGCG TTGCGATATC ACGAGGTACT AAGTTACCAT AATCAGGATA TTTCTCTTCT 2100 

AAGAAGTACC AAGGCTTACC ATCTTTATAT GTCCAAATTC GTCCACCTTC ACCACGTGCT 2160 

GATTCACTCA TTAGTCGCAG TTTATCATCA CCAGGGATTG CAGTAGGATG AATTTGAATG 2220 

AACTCACCAT TAGCATAAAT AGCGCCTTGT TGGTAAACAA TGGAAGCCGC TGATCCTGTA 2280 

TTAATCATTG AGTTTGTTGT TTTACCGAAA ATAATACCAG GGCCACCCGT TGCCATAATA 2340 

ACTGCATCTG AACCAAATGT TTCAATCTCA GCAGTTGTCA TATTTTGTGC AnCGATACCT 2400 

CTTGCACTAT CATCGTCACC TTTAACTATG . CCAAGGAATT CCCATCCTTC ATACTTCGTA 2460 

ACTAATCCAT CTACTTCATA TGCACGAACT TGTTCATCCA ATGCATATAA TAATTGTTGT 2520 

CCAGTTGTTG CCCCTGCATA TGCTGTTCTG TGATGTAATG TACCACCGAA ACGTCTAAAA 2560 

TCTAATAGAC CTTCATTTGT TCTATTGAAC ATTACGCCCA TACGGTCTAA TAAATGAATA 2640 

ATTTTAGGTG CTGCCTCTGT CATCGCTTTA ACAGGTGGTT GGTTTGCAAG GAAATCGCCA 2700 

CCATACACTG TATCATCAAA GTGAATCCAA GGAGAATCGC CTTCCCCTTT AGTATTGACC 2760 

GCACCATTAA TGCCACCTTG GGCACAAACA GAGTGCGAAC GCTTTACTGG TACAACTGAG 2820 

AACAAATCTA CATGTGCACC TTTTTCTGCC GCTTTAATTG TTGACATTAA GCCCGCTAGG 2880 

30 CCACCTCCGA CAACAATAAG ATGTTTCTCT GCCATAAAAA TTTCACTCCC CTAAATTTTC 2940 

AATCTATATT TGTTAAATGC GATGTATTAC ATAAAGGCAA TAATTGCAGT AACACCAATA 3000 

TACGAAATAA CTAAAAATAC GATTAATGAA ACCCATGTAA ATACTCGTTG TGATTTTGGA 3060 

35 GATTGAAGTC CACCCCAAGT AACTAAGAAT GACCATAAGC CATTTGCAAA GTGGAACACA 3120 

ACAGCAATAA TACAAATAAT ATAAAATATT GCCCATCCAG GATGTTGCAA TGTTTCGTGC 3180 

ATTAAATCGT AATTCACTTC TTTGCCGTAA AATGCTTTTT GTAAACGTGT TTGCCATAAA 3240 

TGGATACCAA TAAAGATAAA TGTTAAGATA CCACTCACTC TTTGGAAGAA GAACATCCAG 3300 

TTTCTAAAAA TCGAGTAATG TCCAACATTT TCTTTTGCTG TAAATGCAAT GTGTATACCA 3360 

AACAAACCGT GATATAACAA CGGAATGTAT ATAAATAAAA ATTCTACAAT AATTAGAAAT 3420 

GGTAATGATT CCATAAAGTT AGATGCCTTA TTAAACGCTT CAGCACCTTG TGTTGCTTGG 3480 

TGATTCACTA ATAAATGAAC GACCAAAAAT GCACCTATTG GGATAATACC TAATAACGAG 3540 

TGAATACGTC TTAGATAAAA TTCATTTTTT GATTGAGCCA AAAGGAGTCC CCCCTGTGAA 3600 

CGAATATTTA ATTTATTGAG CTATTTATAT TAAACGTACG CTTAACCCCC TAAAGTGATA 3 660 
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CGATCACCAA ACTGCATGTC GAACAATGTA ACATTTGGAT TCGATATTTA AAATTGCTTG 3780 

TGATGATAAA CTTTCTCATT TAGAAAACGC TTCCACGTAC ATTCAAAAAA ATAACTTTGT 3840 

$ TAACCATATT GTAACATTAT TTCATATATT TTGGGGCATG AGAATGATTC TCACGCCCAG 3 900 

TAATTTATTT ATGCAATTGT TCATGTAGGT TCTTTGCGAC GTTTTCAGGA ATACCTATAT 3960 

TTTTAAAATC TTCAAGTGTA GCTTCCTTCA TTTTCTTGAT TGAACCGAAT GAACGCAATA 4020 

10 

ATAATGTTTT ACGTTTGTTA CCGATACCAT CTATATCATC AAGTATTGAT TTCAAGCCTG 4080 

TCTTTTGACG TGTTTGTCTA TGAAATGTGA TTGCGAATCT GTGAACCTCA TCTTGGATAC 4140 

GGTGCAACAA ATAAAATGCC TGGCTATTTT TCTTCAGTGG TACAATTTCT GCACTAGCGC 4200 

15 

CATATAATAA TTCAGATGTT TGGTGTTTAT CATTTTTCTG CAAACCTGCA ACAGGGATAT 4260 

CAAGACCTAA TTCGTTTTGT AGCACATCAA TAACCCCGTT CATATGTCCT TTACCACCAT 4320 

CTACTATTAT TAAATCAGGT AATGGTAATC CTTCGTTTAA AACGCGAGAA TATCGTCGTC 4380 

20 

TTACTACTTC TCTCATTGAT TTGTAATCAT CTGGACCTTT AACCGTTTTG ATTTTATACT 4440 

TTCTATAATT TTTCTTATCT GGTTTACCGT CGACAAATGT AACCATTGCT GACACTGGAT 4500 

25 CCACACCTTG AATATTAGAA TTATCGAATG CTTCAATTCT AATTGGTGTT TGAATTCCCA 4560 

TTTGTGTTCC AAGTTCTTCA ATAGCTTTAA TCGTTCTGGA CTCATCACGT GATATTAATT 4620 

CAAATTTATT ATTTAAGGAT ACTTTAGCGT TATGTGCAGC TAGGTCAACC ATATCTTTTT 4680 

30 TGGGACCTCG CGCGGGTTGA ACGATTTTAG TGTCCACAAC AGATTGAATC ATTTCTTTAT 4 74 0 

CCAAATTACG TGGTACATGA ACTTCCTTAG GTAAAATATG TTGGTTTAAG CTATAAAATT 4800 

GTCCAATAAA TGTATAAAAT TCTTCTTcTT CTGTTTGCTG TAATGGAATC ATCGTTGTAT 4 860 

CTCGCTTTAT CATATTACCT TGTCGTATAA AGAAAACTTG GATACACATC CATCCTTTAT 4 920 

CAACACTATA ACCAAAGACA TCACGAATCG TTTTATCTGA TGACATAATT TTTTGTTTGT 4 980 

TTGTCAGATT TTGAATATGT TGAATTAAAT CTCTATATTC TTTAGCCCGT TCAAAATCAA 5040 

40 

GTGATTCACT TGCAGTTAAC ATTCGCTCTT CTAAACTTTT TAAAATTGTT TTGTCTTCCC 5100 

CATTCAGAAA ATCAGTAATT TCCTTCGTCA TTTGTGCGTA TTTACTCAAA TCAACGTCAT 5160 

ATACACATGG TCCTAAACAT TGTCCAATAT GGTAATAAAG ACATAATTTA TCTGGCATCT 5220 

45 

TATCACATTT GCGATATGGA TATATTCTGT CTAATAACTT TTTAGTTTCT TGAGCAGAAT 5280 

ATGCATTCGG ATACGGTCCG AAATATTTGC CAGTACCTTG TTTTACAGTT CTCGTCACTA 5340 

so GTAGTCTAGG ATATTTCTCC TTCGTAATTT TAATAAATGG ATAACTTTTA TCATCCTTTA 54 00 

ATAATATATT ATATCTTGGT TGATATTGTT TAATCAGATT CAATTCCAGT AAAAGTGATT 5460 
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TTTTAGCATC ATGAGCACCC GTAAAATATG ATCGCAATC 5559 
(2) INFORMATION FOR SEQ ID NO: 200: 

5 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4594 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

w 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 200: 

15 AAATCAATCG AGTGGCATGT CAAGGTCATA TCAATATTTT AGAATCTGCG ACTATGAGAG 60 
AGGAAATAAA TGAAATTGCG CGACGTATCA TCGTTGATAT TCGTGATAAG CAATTACGAT 120 
ATCAAGATAT TGCTATTTTA TATCGTGATG AATCTTATGC TTATTTATTT GATTCCATAT 180 

20 TACCGCTTTA TAATATTCCT TATAATATTG ATACAAAGCG TTCGATGACA CATCATCCGG 240 

TCATGGAAAT GATTCGTTCA TTGATTGAAG TTATTCAATC TAATTGGCAA GTGAATCCAA 300 
TGCTACGCTT ATTGAAGACT GATGTGTTAA CGGCATCATA TCTAAAAAGT GCATACTTAG 3 60 

25 TTGATTTACT TGAAAATTTT GTACTTGAAC GTGGTATATA CGGTAAACGT TGGTTAGATG 420 

ATGAGCTATT TAATGTCGAA CATTTTAGCA AAATGGGGCG TAAAGCGCAT AAACTGACCG 480 
AAGATGAACG TAACACATTT GAACAAGTCG TTAAGTTAAA GAAAGATGTC ATTGATAAAA 540 
TTTTACATTT TGAAAAGCAA ATGTCACAAG CGGAAACTGT AAAAGATTTT GCAACTGCTT 600 
TTTATGAAAG TATGGAATAT TTCGAACTGC CAAATCAATT GATGACAGAG CGAGATGAAC 660 
TTGATTTAAA TGGTAATCAT GAAAAGGCGG AGGAAATTGA TCAAATATGG AATGGCTTAA 720 

35 

TTCAAATCCT TGATGACTTA GTTCTAGTAT TTGGAGATGA ACCAATGTCG ATGGAACGTT 780 
TCTTAGAAGT ATTTGATATT GGTTTAGAAC AATTAGAATT TGTTATGATT CCGCAAACAT 840 
TGGACCAAGT AAGTATTGGT ACGATGGATT TGGCTAAAGT CGATAATAAG CAACATGTTT 900 

40 

ACTTAGTAGG TATGAATGAT GGAACGATGC CACAACCAGT AmTGCGTCAA GCTTGATTAC 960 
AGATGAAGAA AAGAAATACT TTGAACAGCA GGCTAATGTC GAGTTAAGTC CAACATCAGA 1020 

45 TATTTTACAG ATGGATGAAG CATTTGTTTG TTATGTTGCT ATGACTAGAG CTAAGGGAGA 1080 

TGTTACATTT TCTTACAGTC TAATGGGATC AAGTGGTGAT GATAAGGAGA TCAGCCCATT 1140 
TTTAAATCAA ATTCAATCAT TGTTCAACCA ATTGGAAATT ACTAACATTC CTCAATACCA 1200 

50 TGAAGTTAAC CCATTGTCAC TAATGCAACA TGCTAAGCAA ACCAAAATTA CATTATTTGA 1260 

AGCATTGCGT GCTTGGTTAT ATGATGAAAT TGTGGCTGAT AGTTGGTTAG ATGCTTATCA 1320 
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GTTTGACAAT GAAACTGTAA AATTAGGTGA AACGTTGTCT AAAGATTTAT ATGGTAAGGA 1440 

AATCAATGCC AGTGTATCCC GTTTTGAAGG TTATCAACAA TGCCCATTTA AACACTATGC 1500 

GTCACATGGT CTGAAACTAA ATGAGCGAAC GAAGTATGAA CTTCAAAACT TTGATTTAGG 1560 

TGATATTTTC CATTCTGTTT TAAAATATAT ATCTGAACGT ATTAATGGCG ATTTTAAACA 1620 

ATTAGACCTG AAAAAAATAA GACAATTAAC GAATGAAGCA TTGGAAGAAA TTTTACCTAA 1680 

AGTTCAGTTT AATTTATTAA ATTCTTCAGC TTACTATCGT TATTTATCAA GACGCATTGG 1740 

CGCTATTGTA GAAACAACAC TAAGCGCATT AAAATATCAA GGCACGTATT CAAAGTTTAT 1800 

GCCAAAACAT TTTGAGACAA GTTTTAGAAG GAAACCAAGA ACAAATGACG AATTAATTGC 1860 

ACAAACATTA ACGACAACTC AAGGTATTCC AATTAATATT AGAGGGCAAA TTGACCGTAT 1920 

CGATACGTAT ACAAAGAATG ATACAAGTTT TGTTAATATC ATTGACTATA AATCCTCTGA 1980 

AGGTAGTGCG ACACTTGATT TAACGAAAGT ATATTATGGT ATGCAAATGC AAATGATGAC 2040 

ATACATGGAT ATCGTTTTAC AAAATAAACA ACGCCTTGGA TTAACAGATA TTGTGAAcCA 2100 

GGTGGaTTAT TATACTTCCA TGTACATGAA CCTAGAATTA AATTTAAATC ATGGTCTGAT 2160 

25 ATTGATGAAG ATAAACTAGA ACAAGATTTA ATTAAAAAGT TTAAGTTGAG TGGTTTAGTT 2220 

AATGCAGACC AAACTGTTAT TGATGCATTG GATATTCGTT TAGAACCTAA ATTCACTTCA 2280 

GATATTGTAC CAGTTGGTTT GAATAAAGAT GGCTCTTTGA GTAAACGAGG CAGCCAAGTG 2340 

30 GCAGATGAAG CAACGATTTA TAAATTCATC CAACATAACA AAGAGAATTT TATAGAAACA 2400 

GCTTCAAATA TTATGGATGG ACATACTGAA GTTGCACCAT TAAAGTACAA ACAAAAATTG 2460 

CCATGTGCTT TTTGTAGTTA TCAATCGGTA TGTCATGTAG ATGGCATGAT TGATAGTAAG 2520 

CGATATCGAA CTGTAGATGA AACAATAAAT CCAATTGAAG CAATTCAAAA TATTAACATT 2580 

AATGATGAAT TTGGGGGTGA GCAATAGATG ACAATTCCAG AGAAACCACA AGGCGTGATT 2640 

TGGACTGACG CGCAATGGCA AAGTATTTAC GCAACTGGAC AAGATGTACT TGTTGCAGCC 2700 

GCGGCAGGTT CAGGTAAAAC AGCTGTACTA GTTGAGCGTA TTATCCAAAA GATTTTACGT 2760 

GATGGCATTG ATGTCGATCG ACTTTTAGTC GTAACGTTTA CAAACTTAAG CGCACGTGAA 2820 

ATGAAGCATC GTGTAGACCA ACGTATTCAA GAGGCATCGA TTGCTGATCC TGCAAATGCA 2880 

CACTTGAAAA ACCAACGCAT CAAAATTCAT CAAGCACAAA TATCTACACT CCATAGTTTT 2940 

TGCTTGAAAT TAATTCAACA GCATTATGAT GTATTAAATA TTGACCCGAA CTTTAGAACA 3000 

50 AGCAGTGAAG CTGAAAATAT TTTATTATTA GAACAAACGA TAGATGAGGT CATAGAACAA 3060 

CATTACGATA TCCTTGATCC TGCTTTTATT GAATTAACAG AGCAATTGTC TTCAGATAGA 3120 
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AATCCTACAA 


ATTGGTTGGA 


TCAATTGGTG 


ACACCATACG 


AAGAAGAAGC 


ACAACAAGCG 


3240 


CAACTTATT C 


AACTACTAAC 


AGACTTATCT 


AAAGTATTTA 


TCACAGCTGC 


TTATGATGCT 


3300 


TTAAATAAGG 


CGTATGATTT 


GTTTAGTATG ATGGATAGCG 


TCGATAAACA 


TTTAGCTGTT 


3360 


ATAGAAGATG 


AACGACG l i i 


AATGGGGCGT 


GTTTTAGAAG 


GTGGCTTTAT 


TGATATACCT 


3420 


TATTTAACTG 


GTCACGAATT 


TGGCGCGCGT 


TTG CCTAATG 


TAACAGCGAA 


AATTAAAGAA 


3480 


GCAAATGAAA 


TGATGGTCGA 


TGCCTTAGAA 


GATGCTAAAC 


TTCAGTATAA 


AAAATATAAA 


3540 


TCATTAATTG 


ATAAAGTGAA 


GAGTGATTAC 


TTTTCAAGAG 


AAGCTGATGA 


TTTGAAAGCT 


3600 


GATATGCAAC 


AATTGGCGCC 


ACGAGTAAAG 


TACCTTGCGC 


GTATTGTGAA 


AGATGTTATG 


3660 


TCAGAATTCA 


ATCGAAAAAA 


GCGTAGCAAA 


AATATTTTGfi 


ATTTTTCTGA 


TTATGAACAT 


3720 


TTTGCATTAC 


AAATTTTAAC 


TAATGAGGAT 


VJVJ X J. ^<VJWV« 1 X 


CAGAAATTGC 


CGAATCATAC 


3780 


CGTCAACACT 


TCCAAGAAAT 


ATTGGTCGAT 


GAGTATCAAG 


ATACGAACCG 


AGTTCAAGAG 


3840 


AAAATACTAT 


CTTGCATCAA 


AACGGGTGAT 


GAACATAATG 


GTAATTTATT 


TATGGTTGGA 


3900 


GATGTTAAGC 


AATCCATTTA 


TAAATTTAGA 


CAAGCTGATC 


CAAGTTTATT 


TATTGAAAAG - 


3960 


TATCAACGCT 


TTACTATAGA 


TGGAGATGGC 


ACTGGACGTC 


GAATTGATTT 


GTCGCAAAAC 


4020 


TTCCGTTCTC 


GAAAAGAAGT 


ACTGTCAACG 


ACTAACTATA 


TATTCAAACA 


TATGATGGAT 


4080 


GAACAAGTCG 


GTGAAGTAAA ATATGATGAA 


GCGGCACAGT 


TGTATTATGG 


TGCACCATAT 


4140 


GATGAATCGG 


ACCATCCaGT 


AAACTTAAAA 


GTCCTTGTTG 


AAGCGGATCA 


AGAACATAGT 


4200 


GATTTAACTG 


GTAGTGAACA 


AGAAGCGCAT 


TTTATAGTAG 


AACAAGTTAA 


AGATATCTTA 


4260 


GAACATCAAA 


AAGTTTATGA 


TATGAAAACA 


GGAAGCTATA 


GAAGTGCGAC 


ATACAAGGAT 


4320 


ATCGTTATTC 


TAGAACGCAG 


CTTTGGACAA 


GCTCGCAATT 


TACAACAAGC 


CTTTAAAAAT 


4380 


GAAQATATTC 


CATTCCATGT 


GAATAGTCGT 


GAAGGTTACT 


TTGAACAAAC 


AGAAGTCCGC 


4440 


TTAGTATTAT 


CATTTTTAAG 


AGCGATAGAT 


AATCCATTAC 


AAGATATTTA 


TTTAGTTGGG 


4500 


TTAATGCGCT 


CCGTTATATA 


TCAGTTCAAA 


GAAGACGAAT 


TAGCTCAAAT 


TAGAATATTG 


4560 


AGTCCAAATG 


ATGACTACTT 


CTATCAATCG 


ATTG 






4594 


(2) INFORMATION FOR SEQ ID NO: 201: 









45 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6313 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
so (D) TOPOLOGY: linear 
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GGTTTTCnTG 
TTTaTAAAAT 
ACCTATTTAG 
TTATGCGAAG 
AGTGTTGAAA 
ACAAAGGCAA 
TACAATAAAA 
TTTGCATTTT 
TCCACTAGAA 
AAAGATTCAT 
TAACTATAAG 
GAAATTGCAG 
GAAGTTCCTA 
AAGATTGCAA 
GAAAAAGCAC 
GATAATCAGT 
CATGTAAATG 
GGAGATTTAC 
TTAACTGCAG 
ATTACTAACT 
TATTCAATGC 
GCAGAGAAAC 
AAATTAGGCG 
CATTTTGATA 
TTAGCAAAAA 
ACAACTGATT 
TATTTCTTAC 
ATCGATTTAT 
ACGTTTGGTG 



GAAAGATAGT 
GGCTTACATA 
CTTTAAGAAG 
ATTAAGGTGA 
CAGCACAACG 
TCTAACTTTA 
GTGGATGATG 
GTTGAAGGAC 
GTTAAAACAT 
TATGAATTAT 
GAGATAGGCG 
CAAGTATTAA 
AAGATACAAA 
AGCGTAATCC 
ATGTAAAACA 
ATTTAACAGC 
AATCAAAAGG 
ATATTGGTCA 
CTGGCTATAA 
TAGCGCGTTC 
CAGAAGATGG 
ACCCTGAAAT 
TAGAATACGA 
ATTGGTTTAG 
TGAAAGAATT 
TTAAAGACGA 
CAGATATTGC 
TTGGTGCTGA 
TAGATAGTAA 



GAAAATCTCG 
TATGAAGCGT 
GCATAACAAG 
GTAGTAAATT 
AAAAAGAAAA 
TTCGGTATGT 
ATAGCGTTAA 
AAACGACAAC 
TACGCATTTT 
ATCAAGATAA 
AATGAATATT 
CAAAGCAGGA 
AAATGGAGAT 
TCGTGAAATT 
AATTGACATT 
AATTATTCCT 
TCAAAATGTA 
TGCTAGAAAT 
TGTAACACGT 
GATTGAAACA 
CTATAATGGA 
TAAAGATTAT 
AATGGCTAAA 
TGAAaCATCT 
AGGTTATACG 
CAAAGACAGA 
GTACCACTTC 
TCATCATGGT 
TCGTTTAGAA 



TGTTTTTTGG 
TGATTAAGTA 
ATGACCTTAT 
GGATAAAAAA 
ATTTGAATTT 
AGAACAAATT 
GTTGATTCGT 
AACTTTTTAC 
ACATTTCGTA 
TGAAAAAATG 
ATTGATCAAG 
TTAGCAGATG 
TATGCTACTA 
GCTCAAGCGA 
GCTGGTCCAG 
GAAGCAATTG 
TTGCTTGAGT 
GCAGCAGTTG 
GAATATTATA 
CGTTTCTTTG 
AAAGATATTA 
TCTGAAGAAG 
TTGAAAAATG 
TTATATGAAA 
TATGAAGCTG 
GTATTAATTA 
GATAAAGTAA 
TATATTAATC 
ATTCAAATCA 



TTTTgAGGTG 
TGGAATTGTT 
TTTATGCTAT 
GTAAGTATTC 
ACTACTGAAG 
GAGGATGCAA 
AAAGGCGACA 
GATATATCGG 
AGTGGAGACG 
GGTTCTTATC 
TGAAACAAAC 
AGATTCCTGA 
ATATTGCGAT 
TTGTTGATAA 
GATTCATTAA 
AAAAAGGTGA 
ATGTTTCAGC 
GTGATGCTTT 
TTAATGATGC 
AAGCTTTAGG 
TTGAAATAGG 
CACGTTTGAA 
ATTTAGCAGA 
AAGGAGAAAT 
ATGGCGCTAC 
AAAATGACGG 
AACGTGGTAA 
GTTTGAAAGC 
TGCAAATGGT 



TTGTTTGTAT 
AATTAATTGA 
AATATTTCTA 
AAACAAAGCA 
GAACTTGGCA 
CAGTTAATCT 
TTAATATGAA 
CTGGACGAAT 
GTGGCAAGCT 
AATATGAAAT 
ATTAGTAGAA 
TATTAAAATT 
GGTACTGACT 
CTTAGATACT 
TTTTTACTTA 
TCAATTTGGA 
TAACCCTACA 
AgcTAAtATT 
TGGTAATCAA 
TGACAATAGT 
TAAAGATTTA 
AGAATTTAGA 
GTTCAATACG 
TCTTGAAGTT 
ATGGTTACGT 
TACATATACG 
TGACATTTTA 
ATCTCTTGAA 
TCGTTTAATG 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
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ATTATGGACG AaGTTGGCGT TGACGCTGCA CGTTATTTCT TAACTATGCG TAgTCCTGAT i860 

AGTCACTTTG ATTTTGATAT GGAATTAGCG AAAGAGCAAT CTCAAGACAA TCCAGTTTAC 1920 

5 TATGCTCAAT ATGCACATGC GCGTATTTGT TCAATTTTAA AACAAGCGAA AGAGCAAGGT 1980 

ATTGAAGTGA CTGCTGCGAA TGATTTTACA ACGATTACTA ATGAAAAAGC GATTGAATTG 2040 

TTGAAAAAAG TAGCTGATTT CGAACCTACA ATTGAAAGTG CTGCTGAGCA TAGATCGGCA 2100 

10 

CATAGAATTA CTAATTATAT TCAAGATTTA GCTTCTCATT TCCATAAATT CTATAATGCT 2160 

GAAAAAGTGT TAACAGATGA TATTGAAAAA ACAAAAGCAC ATGTTGCTAT GATTGAAGCG 2220 

GTCAGAATTA CATTGAAAAA TGCATTGGCA ATGGTCGGTG TAAGCGCACC TGAATCAATG 2280 

15 

TAAGAACATT TATATACACT CCAACGTAGA GTTTCTCGAA AGATACTTTG TGTTGGAGTG 2340 

TTTTTTTTAG GTATGTGACA TATTGGGGAA TGCTTAGTAT GTGAATAAGG TTAAGAGGAA 2400 

20 CACAGTTGGA TGCTCTGCAC AACTGCATAA GAGAGCCTGA GACATAAATC AATGTTCTAT 2460 

GCTCTACAAA GTTATAATGG CAGTAGTTGA CTGAACGAAA ATTCGCTTGT AACAAGCTTT 2520 

TTTCAATTCT AGTCAACCTT GCCGGCGGGG CCCCAACAAA GAGAAATTGG ATTCCCAATT 2580 

25 TCTACAGACA ATGCAAGTTG GGGTGGGACG ACGAAATAAA TTTTACGATA ATATCATTTC 2640 

TGTCCCACTC CCTCTAAAAT GGAGGGTGTA AATGTTAGGA ACTGATGAAT TATATAAAGT 2700 

TTTATATGAA CATCTCGGAC CACAATTTTG GTGGCCTGCT GATAATGACA TTGAAATGAT 2760 

30 GTTAGGTGCA ATTTTAGTTC AAAATACTAG ATGGCGAAAT GCAGAAATTG CATTGAATCA 2820 

GATTAAAGAA CATACGCATT TTAATCCAAA TCATATATTA GAACTACCTA TTGAAACGTT 2880 

ACAATCATTG ATACATTCAA GTGGCTTTTA TAAAAGTAAA TCACTGACGA TTAAAACATT 2940 

35 

ATTAACATGG TTAGCACGAC ATCATTTCAA TTATCAAGAG ATTAATGAGC GATATAAAGG 3000 

TGGATTAAGA AAAGAATTAT TATCTTTGAA AGGTATTGGA AGTGAAACAG CAGATGTCTT 3060 

ACTTGTTTAT ATATTCGGAC GTATTGAATT TATTCCAGAT AGCTATACAA GAAAAATATA 3120 

40 

TGATAAATTA GGATATGAAA ACACTAAAAA TTATGATCAA TTAAAAAAAG TAGTCaCATT 3180 

ACCAAATCAT TTTACAAATC AAGATGCTAA TGAATTTCAT GCTCTGTTAG ATGTATTTGG 3240 

TAAACATTAC TTTAGAGACA AAGATATAAA GAATTATGAT TTTTTAGAAC CTTACTTTAA 3300 

45 

AAAGTAAACG CTGTGAAGTT AGATAGATGA GTTTATATGA AATATAAAAA ATAATTTACT 3360 

ATTTTCTTTT AGTATGTGGA CTTATATAAT AAATAGAAGC ATATAAAGAA AAAAACAGTT 3420 

50 GTTTGTTTGT GCAGCAACTG CATAAGAGCC CCTAATCGCT AAAGCTCAAG GGGAGTAAAG 3480 

GAATACAGTT GTTTGTGCAG CAACTGCATA AAAGCCTCTA ATCACTAAAG GTGAAGAGGA 3540 
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AACGCAGTTG GATgCTACCG CACAACTGCA TAAATCCCTC TaATCgcTAA AGCGAAAAGT 3660 

GGGATTAAAA AGGAGATGTG ATAGTGTGAA GAAATCGTTA ATTGCTTTTA TTTTGATTTT 3 720 

TATGCTTGTC CTGAGTGGCT GTGGTATGAA AGATAATGAT AAACAAGGTA GCAATGATAA 3 780 

TGGCTCGTCT AAATCGCCGT ACCATAGAAT TGTTTCGTTA ATGCCTAGTA ATACTGAAAT 384 0 

TTTATATGAA TTAGGATTAG GTAAATACAT AGTTGGTGTT TCAACGGTTG ATGATTATCC 3 900 

AAAAGATGTG AAAAAGGGTA AGAAACAATT TGATGCTTTG AATCTAAATA AAGAGGAACT 3 960 

TTTAAAGGCA AAGCCAGATC TAATTCTTGC GCATGAGTCG CAAAAGGCAA CTGCTAATAA 4 020 

AGTATTGTCA TCATTAGAGA AACAAGGCAT CAAAGTAGTG TATGTTAAAG ATGCACAATC 4 080 

AATTGATGAA ACTTACAACA CATTTAAGCA AATTGGGAAA TTAACGCATC ATGATAAGCA 4140 

GGCTGAACAA CTTGTTGAGG AAACTAAAGA TAATATCGAT AAAGTCATAG ATTCAATTCC 4 200 

TGCTCATCAT AAAAAATCAA AAGTATTTAT TGAGGTTTCA TCAAAGCCTG AAATATATAC 4260 

AGCAGGGAAG CATACATTTT TTAATGATAT GTTAGAAAAA TTAGAAGCCC AAAATGTGTA 4 320 

TAGTGACATT AATGGTTGGA ACCCTGTAAC GAAGGAAAGT ATTATTAAAA AGAACCCAGA 4380 

25 TATATTAATT TCGACGGAAG CTAAGACAAG ATCAGATTAT ATGGATATCA TCAAAAAAAG 444 0 

AGGTGGATTC AATAAAATTA ATGCTGTCAA GAATACACGT ATTGAAGTTG TAAATGGTGA 4 500 

TGAAGTATCA AGACCAGGTC CACGTATTGA TGAAGGATTA AAAGAATTAA GAGATGCAAT 4560 

30 TTATAGAAAA TAAACCATTC TAATTATGCC CCTTATTGCT ACATGTAAAA AATACATGTT 4 620 

TGAGATAAGG GGTTTTTaAA ATATATTTAG TGAATGATAG CAACGCGAGT ATGTGATTGC 4 680 

TATAATGAAT GTAATTATCG ATGAAcaaAA GAGAATGCTA TGACATTTAA TAAAGTATTA 4 740 

TTGAGCTGGa TAGTCmTATT GATTATAACA ACTAGCATAT ATCTATTTTG GCAGTTGGGC 4 800 

GATATCAATG ATGTATTTAA CCAGTCTATT TTAATCAATG TTAGATTACC GAGATTATTA 4 860 

GAAGCATTGT TGACAGGTAT GATATTAACT GTTGCAGGCC TTATATTTCA AACAGTTTTA 4 920 

AATAATGCAT TGGCAGATAG CTTTACATTA GGATTGGCAA GCGGCGCTAC ATTTGGTTCA 4 98 0 

GG ATT AG CAT TATTTTTAGG TTTAACAACG TTATGGATTC CTGTATTTTC AATAACATTT 5040 

AGTTTGATAA CATTAATAAC TGTATTAGTC ATTACGTCGG TATTGAGCCA AGGCTATCCA 5100 

GTTAGAATCT TAATATTAAG TGGTTTAATG ATTGGTGCGT TATTCAATTC ACTTCTATAT 5160 

TTTTTGATTT TATTAAAACC TCGCAAATTA AATACAATTG CCAATTATCT GTTTGGTGGT 5220 

so TTTGGTGATG CAGAATACTC AAATGTATCT ATAATAGCAA TCACATTTAT CATTGCATTG 5280 

TTTGGTATAT TTATCATTCT TAATCAACTA AAGTTATTGC AATTAGGAGA ACTAAAAAGT 5340 
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ATAACGGCGA 


TAAATGTCGC 


ATATGTTGGC 


ATCATTGGAT TCATTGGTAT 


GGTGATACCG 


5460 


cAACTCATTA 


GAAAATGGCA 


GTGGAAACAA 


TCATTAGGAA GACAATTGGC 


TTTAAATATT 


5520 


GTAACTGGAG 


GACAAATAAT 


GGTTATGGCA 


GATTTTATTG GTAGCCATAT 


ATTGTCACCA 


5580 


GTACAAATAC 


CGGCAAGTAT 


TATCATTGCA 


TTAATTGGTA TACCAGTGTT 


AtTTTACaTG 


5640 


CkAAwAtCtC 


aGTCgAAAcG 


GTTACaCTAG 


CACACGACaT TTGCTAAAAT 


AAAAATAACT 


5700 


ATAAACATAA 


AGAGGGCATA 


AGCGATGGAT 


TTGAATCAAA TTAAAGCAGT 


TGTATTTGAT 


5760 


TTAGAAGGTA 


CGTTGTTGGA 


CAGAGTTAAA 


TCTCGAGAGA AATTTATCGA 


AGAGCAATAT 


5820 


GAACGATTTC 


ATGACTACTT 


AATTCATGTT 


CAACTGGCAG ATTTTAAAAA AgCATTTATT 


5880 


GAGCTAGATG 


ACGATGAAGA 


TAATGATAAA 


CCTGATTTAT ATAAAGAAAT 


CATTAAACGT 


5940 


TTCCATGTAG 


ATAGGTTAAC 


TTGGAAAGAC 


TTATTTAATG ATTTTGAAAT 


GCATTTTTAT 


6000 


CGTTATGTAT 


TTCCTTATTA 


CGATACTTTG 


TATACACTAG AAAAg CTATC GCAAAAAGGC 


6060 


TTTCAAATTG 


GTGTTATCGC 


AAATGGTAAA 


TCTAAGATTA AACAATTTCG 


ATTACATTCA 


6120 


CTTGGTTTGA 


TGCATGTTAT 


TAATTATTTA 


TCAACATCAG AAACAGTTGG 


TTTTCGTAAA 


6180 


CCACATCCTA 


AAATTTTTGA 


AGATATGATT 


GATCAACTAG GGGTATTACC 


TGAGCAAATT 


6240 


ATGTATGTTG 


GCGATGATGC 


GTTAAATGAT 


GTAGCTCCAG CACGAGCTAT 


GGGCATGGTT 


6300 


AGTGTATGGT 


ATA 








6313 



30 (2) INFORMATION FOR SEQ ID NO: 202: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2174 base pairs 
<B) TYPE: nucleic acid 
(C) STRANDEDNESS : double 
35 (D) TOPOLOGY: linear 



" (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 202: 

40 



45 



SO 



CCGTAAACAC ATCAACAAAA 


GAAGGCTATA 


TTACAAAAGA 


AGACTTGGAC 


TTATGCTGCA 


60 


CGTCGCTCTA ATTCAGCTGG 


AATGCAAGTC 


ACCGGACGAC 


TGGCTTACAT 


TGAACCTTAT 


120 


GGGGCAACAA GTCGCACAAA 


ATAAACGCGC 


GAGAAGCaAG 


AATAGGAAGT 


GATATCTATG 


180 


AAATGGTTAT CACGAATATT 


AACAGTAATA 


GTGACCATGT 


CtATGGcGTG 


TGGTGCATTG 


240 


ATATTTAATC GTAGACATCA 


GCTAAAGGCG 


AAAACGCTGA 


ACTTCAATCA TAAAGCATTA 


300 


ACAATTATTA TTCCGGCTAG 


AAACGAAGAA 


AAAAGAATAG 


GTCATTTACT 


ACATTCGATA 


360 


ATACAACAGC AAGTTCCAGT 


AGATGTCATT 


GTTATGAATG 


ACGGATCGAC 


AGATGAAACA 


420 
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AAATGGTATG GGAAATCACA TGCTTGTTAT CAAGGTGTGA CGCATGCATG TACGAATCGC 540 

ATTGCCTTTG TAGATGCTGA TGTAACTTTC TTAAGGAAAG ATGCTGTTGA AACGTTGATT 600 

AATCAGTATC AATTACAAGG TGAAAAAGGA TTGTTAAGCG TACAGCCTTA TCATATAACA 660 

AAGCGTTTCT ACGAAGGGTT TTCAGCGATA TTTAATTTAA TGACAGTCGT TGGTATGAAT 720 

GTATTTTCTA CCTTAGACGA CGGTCGGACT AACCAGCATG CATTTGGACC GGTGACATTA 780 

ACAAATAAAG AAGATTATTA TGCAACTGGA GGTCATAAAA GTGCAAACCG TCATATTATT 840 

GAAGGATTTG CTTTAGGAAG TGCATATACT TCACAATCAT TGCCCGTAAC AGTTTATGAA 900 

GGGTTTCCAT TTGTTGCATT TCGCATGTAT CAAGAAGGAT TTCAGTCATT ACAAGAAGGA 960 

TGGACAAAGC ATTTGTCAAC TGGGGCAGGT GGCACAAAGC CTAAGATCAT GACAGCAATT 1020 

GTGTTGTGGT TGTTTGGTTC TATAGCGAGT ATTTTAGGGC TATGTCTTAG TTTAAAATAT 1080 

CGCCAAATGT CTGTAAGAAA AATGGTAGCA CTTTACTTGA GCTATACTAC ACAATTTATT 1140 

TATCTGCATC GAAGGGTCGG CCAATTTTCT AATTTATTAA TGGTATGTCA TCCATTGTTA 1200 

TTTATGTTTT TTACTAAAAT TTTCATCCAA TCTTGGAAAC AAACGCATCG TTATGGTGTA 1260 

25 GTTGAATGGA AAGGTCGTCA ATATTCTATA TCTAAAGAAC AATAAATCAA GGTAATGGCA 1320 

TTTCAATATA GGAGGACTAG TATGACAATG ATGGATATGA ATTTTAAATA TTGTCATAAA 1380 

ATCATGAAGA AACATTCAAA AAGCTTTTCT TACGCTTTTG ACTTGTTACC AGAAGATCAA 1440 

AGAAAAGCGG TTTGGGCAAT TTATGCTGTG TGTCGTAAAA TTGATGACAG TATAGATGTT 1500 

TATGGCGATA TTCAATTTTT AAATCAAATA AAAGAAGATA TACAATCTAT TGAAAAATAC 1560 

CCATATGAAC ATCATCACTT TCAAAGTGAT CGTAGAATCA TGATGGCGCT TCAgCATGTT 1620 

GCACAACATA AAAATATCGC CTTTCAATCT TTTTATAATC TCATTGATAC TGTATATAAA 1680 

GATCAACATT TTACAATGTT TGAAACGGAC GCTGAATTAT TCGGATATTG TTATGGTGTT 1740 

GCTGGTACAg TAGGTGAAGT ATTGACGCCG ATTTTAAGTG ATCATGAAAC ACATCAGACA 1800 

TACGATGTCG CAAGAAGACT TGGTGAATCG TTGCAATTGA TTAATATATT AAGAGATGTC 1860 

GGTGAAGATT TTGACAATGA ACGGATATAT TTTAGTAAGC AACGATTAAA GCAATATGAA 1920 

45 GTTGATATTG CTGAAGTGTA CCAAAATGGT GTTAATAATC ATTATATTGA CTTATGGGAA 1980 

TATTATGCAG CTATCGCAGA AAAAGATTTT CAAGATGTTA TGGATCAAAT CAAAGTATTT 2040 

AGTATTGAAG CACAACCAAT CATAGAATTA GCAGCACGTA TATATATTGA AATACTGGAC 2100 

50 GAaGTGAGaC AGGCTAACTA TACATTACAT GAACGTGTTT TTGTGGaTAA GAGGAAAAAG 2160 

GCAAAGTTGT TTCA 2174 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4 715 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 203: 

10 



15 



20 



40 



45 



GAAnCAGnTA 


GACAAATTAT 


GGaAAmCGGT 


GTGAATCaAG 


GATTCtTTGG 


TGTAGCTGGT 


60 


TTTGACCTAC 


TCGTCGATGA 


GGATGATAAC 


GTTTATGCGA 


TTGATTTAAA 


CTTTAGACAA 


120 


AATGGTTCaA 


CGAGCATGTT 


ATTACTTGCT 


AACGAGTTGA 


ATTCAGGATA 


TCAAAAGTTT 


180 


TATAGTTATC 


ATTCAAAAGG 


TGATAACACA 


CATTTCTTCA 


ATACGATTTT 


GAAATATGTC 


240 


AAAGAAGGTA 


GTTTATACCC 


GTTATCTTAT 


TATGATGGTG 


ATTGGTACGG 


TGAAGATAAA 


300 


GTTAAATCAA 


GGTTTGGCTG 


TATTTGGCAT 


GGTGATTCAA 


AAGAAACAGT 


ACTGGAGAAT 


360 


GAACGCGCAT 


TTTTAGCTGA 


ACTTGAACAC 


TATTAGAGTT 


CGGAACATAA 


GGCGCTACAA 


420 


TGTTGTGTTG 


CCAGTAGTTG 


ACTGAATATG 


CGTTTGTAAC 


AAGCTTTTTT 


CGATTCTAGT 


480 


CAACAGTAAT 


TAAATTTATG 


ATATGGCAAT 


ACTTTGTAAT ACTAATATTA AATGGCGACT 


540 


TTTATTTCAC 


TATGTTATAA 


GAGTTGCCAT 


TTTGTTGATA 


AAGGTATACT 


AAAGGTTATC 


600 


GTTTTGAAAT 


TTTTAGTAAC 


TAGATATGTT 


TCGTGTTATA 


GACCGAATTT 


GTGTATACGT 


660 


AAAATTTAAT 


GCTATTGAAT 


TTTTAAAATG 


AAAAACATGA 


CATTAAATTG 


AATTCATAAT 


720 


ATGTCTAATT 


GACTAACTTG 


TTGGAGTCAT 


TTACTATTTT 


ATGTATGACA 


TATTTTAAAA 


780 


AGTGAGGGTC 


AAGCATGTCT 


TATAAAGCAT 


ATCCATTCTT 


TAGAGATATA 


TTAATAAATG 


840 


AATGTATTTA 


TTTCGCCTCT 


AAAAATAAAA 


AACTAGTACG 


CCTAAATTAT 


AAAAGTGAAG 


900 


CGnATGTAGG 


CGTTTGGACA 


GAAGAAAGTG 


TGGCCGTATC 


ATTTTTAACA 


AGTCGTGATA 


960 


TTCCATTTGA 


TAAAGTTGTA 


AAAATGGACG 


TTGATCGTTT 


TGCTACTTAT 


GAATTAGATG 


1020 


AATTGTTTGA 


TGAACAAGAC 


CATATTATTA 


TGAATCAAAC AATGGAAGAw 


GAAGGGCATC 


1080 


TACTAAACGT 


TGTAGCTGTT 


ACACAAGAAG 


TGATGACGGA 


ATTAGATAAA 


ATTAGAATCA 


1140 


AAGAATTTGT 


CCAAGATGTA GCGAAATATG ATGAAGTATA CGGCTTAACT AAAAAAGGTA 


1200 


GTAAGCAGTT 


TATTCTCATT 


AGTGAAAATG 


ATAGCGACGA 


AAAAAAGCCG 


CATATTATGC 


1260 


CTGTATGGAG 


TATTAAAAAC 


AGAGCGTTAA 


AAGTTCGAGA 


TGAAGATTTT 


GAAGAGTGTG 


1320 


ATTTAATTAC 


GATTGAAGGT 


TCTGTTTTCG 


GAGAATGGCT 


AGATGAACTT 


AGAGATGATC 


1380 


ATAAAGCCGT 


TGCGATAGAT 


TTAAAAACTG 


GCGTGGTTGG 


TACAATTGTT 


TCAGCGCAAA 


1440 
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ATGGAACAAT 


ACGTATTCAA 


AACACTTAGA 


CCATAAAATA AAAGGCCATT 


TATATAGCGT 


1560 




TTATTTAAAA 


CAACGCGCAT 


ATAAATGGTC 


TTTTTCTATT TTTCTAAATA TAATGCACCA 


1620 


£ 


ATAGCACCTG 


nAAAATGCGC 


CGTTTTCAAC 


ATAGTACGGT 


TTGCAACCGC 


GTAACACAGT 


1680 




ATAATCTTCC ACAACTTTGC GTAATAAAGC GTTATTATGA AATGAAGAAC CGATATAAAC 


1740 


10 


GATATTTTCA 


GTTTTAAATT 


CACGTGCAAC 


AGTAATGGCC ATTGTCGTAA CAACTTCGCC 


1800 


AALUALACCA 


ATAACGGCTG 


CTAATTTATT 


GCTAGGTGTA 


AAATCAGCAT 


CTAAATGATG 


1860 




TAGTACATGA 


CCAAAATTAG 


CTGCTGTTAA 


ATCACCGGGA 


ATGGGTGGTT 


CGGTATCTTT 


1920 


15 


ATAAATATGT 


CTAACCTTTA AATCGATAGT 


GTTACGATCA 


CCGTGTTGTG 


CCATGTCAGT 


1980 




TAACTGTTTA 


TAATCAGTGA 


TTTGACTTAG 


TAAATAACCG 


AGTCCTTGAA TCATGCCTCC 


2040 




ACCTGTACCG 


ATACCGCCTA 


CACGACGTTG 


TGATTGGCCG 


TCGAAATAAT 


GTAGTGACGT 


2100 


20 


ACCGGTACCA 


ACATTTGCAA 


AAATATAATC 


TGCTAAGTCA 


TGGCCTTGCT 


CTTTTAACAA 


2160 




AATACCTAGT 


CCTTGAGATG 


CAGCATCAAA 


CTCTACAAAA 


ATTTGTGCAG 


GAATGTTGAT 


2220 




GTTTTCAGCA 


ATGACACCTG 


CATTACCTCC 


AGTTAAGCAT 


AATTTTTCAA 


TTTGCTGTTG 


2280 


25 


GTTTAACCAT 


TCCACAACTT 


GATCAATATT 


TTTAGTTAAT 


TCAGTTTTAA 


AAGTACGTTG 


2340 




GTTATCTTGC 


TCTTGAACGA 


TTTTAATTAG 


TGTACCGCCA 


GCGTCAATGC 


CAACTTTCAT 


2400 




AAGATTCCCA 


CCTCATTATT 


AATGTCTATC 


CTTAAATAAT 


AGTATAGTAA 


AATGACTAAA 


2460 


30 


AAACAAGTAA 


TAATAGTAAT 


TATTAACAAA 


TTTGATGCCa 


TTGCATTTCA 


ACATTGTAAG 


2520 




cGTATCGCAA 


TTAAtGTTTT 


ACAAACGTGG 


ACGTTAAGT t 


ATATATATTA 


TTTTCTAGGA 


2580 


35 


ATTTTGAAGT 


TGTATAGGAT 


TGTTAGTTAG 


TGACGCAATA 


TTAAAAGTAG 


TTCGTACGCA 


2640 


GTGTATTTGT AAGTCTCTGA 


TTAAAATGAT 


AAGTAATGAG 


GAATAGTACA 


TTAATTTTGA 


2700 




AATTTAAAAA 


ATATAAATAA 


GTAATTTATT 


TAACTTAGAG 


CAAATAATGG 


TATCGTAGTG 


2760 


40 


AAATAATAGG 


TAAAATAATA 


TGGGGATTCA 


TGCTTCATAT 


ATAAAAAGAT 


AGGGG TTAAA 


2820 


TATATGGCTA 


AAGAACTTTG 


TTTTGAAGGT 


ATCACTTTAA 


AAGCATTTGA 


TGAACAATAT 


2880 




CGTTCAGCAA 


TTAATGATTT 


TGACTTGAAT 


GAAAGACAAC 


AAATATATTC 


ATCTTTACCT 


2940 


45 


AAAGAAGTTA 


TTGATGATGC 


AATTAATGAT 


GCTGATAGGA 


TTGCTAACGT 


AGCAwTAAmC 


3000 




GATAAAAATG AAGTGGTGGG 


CTTTTTTGTA 


TTACATCGTT 


ACTATCAGCA 


TGAAGGTTAT 


3060 




GATACACCTG AAAATGTCGT 


TTATATTCGT 


TCATTATCGA 


TTAATGAAAA ATATCAAGGT 


3120 


50 


TTTGGATATG 


GCACGAAAAT 


AATGATGTCA 


TTGCCGCAAT 


ATGTTCAAGG 


TGTATTTCCT 


3180 




GATTTTAATC 


ATCTATATCT 


AGTAGTAGAT 


GCGGAAAATG 


ACAATGCTTG 


GAACCTATAC 


3240 
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CTATATTACT TGGACTTAGA TTCAAAACAT GTTTCATCAT TAAAGCTTGA AGAAGAAAGT 3 360 

CGTTCAGAAG TGACCAATGT ACATATCATT AATTTAATGA TTGATGGCCA AAAGGTTGGC 3420 

5 TTTATCGCAT TGGAGCAGAT TGGTGAACGC ATGAACATTG CTGCTATTGA AGTGGATAAA 3480 

TCATATCGCT TTAATGGTAT TGGTTCAAGT GCTCTGCGAC AATTGCCAAC TTACTTAAGA 3540 

AAAAACTATG ACAACCTTAA TGTGATTACG ATGATTCTGT TTGGAGAGAA TAATGATTTT 3600 

AAACCATTAT GTTTAAATAG TAATTTCGTT GAAATCGAAC AAACTGATGA TTATGTCGTT 3660 

TTCGAAAAAT ATTTAAATTA CTAACAGTGA TTGOGAAATA TGATATTGTC ATTTATAATT 3720 

1S TAGTTTTGTT ACTATATATA AATGAATTCA GACGTATAAA TTTAGATTAT ATCCTTCGAA 3780 
AGGAAGTATT GGGCAATGAA AATTCAAGAT TATACAAAAC AAATGGTTGA TGAAAAATCA . 3840 

TTTATTGATA TGGCTTATAC ATTATTGAAT GATAAAGGCG AAACAATGAm mTTATATGAT 3 900 

20 ATyATCGATG AATTTAGAGC GTTAGGTGAT TATGAGTACG AAGAAATTGA AAATCGTGTT 3 960 

GTACAATTTT ACACGGATTT AAACACAGAT GGTCGTTTTT TAAATGTTGG AGAAAATTTA 4020 

TGGGGATTAC GTGATTGGTA TTCGGTAGAT GATATTGAAG AGAAAATCGC ACCAACTATT 4080 

25 CAAAAATTCG ATATTCTGGA TGCAGATGAT GAAGAAGATC AAAACTTAAA ATTATTGGGC .4140 

GAAGATGAAA TGGATGACGA CGATGATATT CCAGCTCAAA CAGATGATCA AGAAGAACTA 4200 

AATGATCCAG AAGATGAGCA GGTTGAAGAA GAAATCAATC ATTCGGATAT AGTCATTGAA 4260 

30 GAAGATGAAG ATGAACTAGA CGAAGACGAA GAAGTGTTTG AAGACGAAGA AGACTTCAAC 4320 

GATTAATTTT TTGTTTGACT TTTAGTTGAA AGATGATAAA ATTTTATTCG GGCTCCTTTA 4380 

AATAGGACAC GTGTATAAAA TTTATACGCT CCCCTTACAG AATTTGTGAG AGGGAGCGTT 4440 

35 

TTTTtATTTA ATTGAGTAAA TCAAGAAATG ATAACGCAAA AATCAAAGTT GTAAATGATA 4 500 

TACAJAGTGA CATAGCAGTA TGGAAACGGT AAGTAAACAG AATTTAATTT TGTCGAtTCG 4560 

ACAAtAAaCA aCTtGAaTGA GCTTGCTTTA ATGTTATGTn nTACGTAATT TTTACAATTG 4620 

40 

ATGAGGAAGC ATTCCCTTTA ATAATTAGGA GGTCAAGACA TGACAAAATT TATTTTTGTA 4680 

ACAGGTGGCG TAGTTTCATC CATTAGGGGA AGGGT 4715 
45 . (2) INFORMATION FOR SEQ ID NO: 204: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 918 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
50 (D) TOPOLOGY: linear 
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ATAATAACTG AAATTAAAAT TGCTAAATmG TGTTaAgCTA TCGCmACAAT GAAAATwCCG 60 

ATTTTGCGTT GTTGAAAATA TCTTTCCAAA CCAAGAATCG ATAATGGCAA TAAATATAAT 120 

5 

AAATTTCCAT AAAATGACCA AGTAAAATTA AAGTATATAA CGACAGTTGA CATGCCGTAT 180 

AAAATCGTAG CGATCATATT TGCTGAGCGT TTAAAGTGTA ATATTTTAAA TAAGTAGAAG 240 

GTCACGACAA ATGTTATGAT AGCTCGTATC ATAGCCATAA TAAGTTGGTT TGTCGGCCAA 300 

10 

AAATGTATTG TCGTCGGATT AAATATACCA ACCGTTTCTC CTATTTTAAT GAAkAGAAAA 360 

TTTAGCCACA TTAAAGGTGA CAGCGAATAA TAATnTGATA GTCCTTTCAT ATAATCGCCA 420 

15 CCTAmTCCAA ACGATGCATC ATrTAAACTA GAAnAACTAC GTAGATGTTC ATACAnATAC 4 80 

ATTTGAAATG GCATCATTTG ACGGAATCCA TCTCCAGCCC CGCTAAAAAC AGTACCATTC 540 

ACAATATAAT CATAGATATG AGTAGAAAAT AAAATAAGCG TTAATATTAC ACTAATGAAA 600 

20 GTTATAACAA AGAATTGTTT GACGTTTGAA TTTAGCCACT TTTTTAACAC AACATTATCC 660 

TCAACTTTCA AATTTAAAAT TAAGTTTAAC TGAAACTAAA GTTAATGAGG TTCTTGATAG 720 

GTAAAGACGA AGATGACTGT GGAACAGATA CCTTATCATA GTTACTTAAA CTTTGGATCA 780 

25 TTTTCAGTTT ATCATTAAAC AAATATATTG AATAATAAAa aTGTCATACT GATAAAGATG 840 

AATGTCACTT AATAAGTAAC TTAGaTTTAA CAAATGATGA TTTTTAATTG TAGAAAACTT 900 

GAAATAATCA. CkTATACC 918 
(2) INFORMATION FOR SEQ ID NO: 205: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 16397 base pairs 

(B) TYPE: nucleic acid 
35 (C) STRANDEDNESS : double 

(D> TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 205: 

40 

TCGCCCnATA ATCAATTTAT TTTTCATGTG CCACTCCTAT ACAAGCTnAC AATGCTTCTT 60 

CAGTTAAGGC AATATCTTTT AATTTTGTTT GATATTTTTG TTCAAAGTCA TATTGTAACT 120 

45 GAACAATTTC TGGCAAACCA ATATGCCAAT CCGCCAATTT TTTTTTAyCT TtGAAGAGCT 180 

CTTTTGGTGA TGkTTGcGAC ACTATACTAC CTTCTTTCAT AACGATGACT TCATCTGCAT 240 

AACGCGCGAC TTCATTCATA TCATGTGAAA TTAGGATAAT TGCCTTATTT TCATCTGTTT 300 

50 GTAGTGACTT TAGTAATCTC ATTACTTGTC GTTTACTTTG TGGATCAAGT CCTGCTGTAG 3 60 

GTTCATCAAC CACGATAATA TCAGGATTCA TTGCCAATAT CGATACAATC GCTATTTTAC 420 
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AATCCATCAA CAGACGATGG GCATAGTTTT TGGCTTCATC TAAATTCATT TTAAAGTTTT 540 

TAGGTCCAAA TATCATTTCA CGCTCTACTG TGTCCTCAAA TAATTGAGAT TCGGGAAATT 600 

GAAATACCAT TCCAATTCTT TTTCTTACAG GTCTAATATA TTTATCTTTG GTCTTATGTG 660 

TAATAGTAAT GTCATCAACT GTAACTGTCC CAGTAGTCGG CTTTAACAGC GCATTAATAT 720 

TTTGTATCAA CGTTGATTTA CCACTACCCG TTTGTCCAAC GATGGCGTAA TATTTACCTT 780 

GTTCAAATTC TGTATTAACA TCATGAATAG CTTGATGCTG ATATGGTGTC CCTTTTTGAT 840 

AGGTATAACT TACATTGTCA AACCGTATAG TCATAGTTGA TCCACCAGCC CTTCATAAGT 900 

TAAGAATGAT GTTTGGTGTC CCAGCATTTG ATTTATTTTG ATTGGGAATG GCAAATCTAG 960 

ACCTATTCTT GTTAACTCTT CTGCATTGTC GAAAATTTCA GTCGCTGTGC CTTCTTTATA 1020 

GACAGTCCCT TTATTCATAA CGATAACATG ATCTGCTTCC ATCGCCTCAG ATAAATCATG 1080 

CGTAATAGAA ATGATTGTAA TATTATGTTC TGATTTAACT TTTCTCACTA AATCCAATAA 1140 

ATTTTGACGT GCATCAGGAT CTAACATAGA AGTCGCCTCA TCTAATATAA TGACAGAGGG 1200 

GTTAAGTGCT AATACACTTG CTATAGCCAC ACGCTGCTTC TGTCCCCCCG ATAATGCATT 1260 

25 AGGTTCATAA TCTGCACGTT CTAACATATC AACTTGTTTA AGTGCTTCGC TGACTCTTCT 1320 

ATGCATTTCG TCATATGGAA CCGCATGATT TTCGAGTCCA AATGCCACAT CGTATTTTAC 1380 

AATTGAACCA ACAAATTGAT TATCCGGATT CTGAAATACA ATTCCTATGT CTTTTCTTAA 1440 

30 CTTTTCAAAA TTATCATCAG TTATAGCTTG ATTATTATAA AAAATTTCTC CAGATTTAAC 1500 

TTTCTCTATG CCAATCATTA ACTTGGcAAT TGTAGATTTT CCAGAACCGT TATGACCAAC 1560 

AATAGATGTC CACTGACCTT TAGGTATATT AAAAGAAACA TCTTTCAATG TGAAGGATGC 1620 

ATCACTTTGA TATTGAAATG AAACATTTTT AAATACAATA ACTGAATTCT TATCCTCCAC 1680 

TTGTCTCTCT CCTTTACGAT TCGTGTATCT ATCATATTTT ACAATATTTA TAAATCGCTG 1740 

TATATGACAT TGACTGGGTT CTCTATATAT TACTAGTATT TTCTGACTCA TTTCTAGTCT 1800 

TTAAAGTGTT GTTTAACAAC TAATGATAAG GACTTTTATT CCTCTCTAAC AATTATGTAT 1860 

AAACGTTAAT AAAATAAATG ATTTACTAAT ATAGGGGTGG TCGCGTTTGA TTCAACGATA 1920 

ATACTTTCAC TTCATTCAGT TCTAGTGAAA TTGATCAAAC TAGCTTCATC ATATTTTTAG 1980 

ATTCGCACTC AAAAAAGTAA ATATAAAGAA ATCGGACTTA AAAACATTTC TGTTCATAAG 2040 

TCCGATATTT TATTCAATAA AAAAGCGCGC ACCCCATCAT AAGTTTGTTG AGTTCACGCT 2100 

TTAAATCTTT ATTTAGTTGA TGGGGTACTC TGAGCTAGAC AATATTTGTA TGTGGCAAAC 2160 

ATTAtCGTTG CACTCATTTG CTTTATATAA AAGTAGTTAG TGTATTTATA TAAATTCTTA 2220 
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ACGAGTGTAA 


CCACCTTGAC 


GTTCTGTGTA 


AcGCTCTGCG 


ATTTCACCAA 


ATAATTTTTG 


2340 




AAGTGCAGTT 


TGTGTAGTTT 


CATCTTCGTT 


TAAGATTTCA 


ACATTACGTA 


AAGTTTTAGC 


2400 


5 


TGCATTACGA 


CGAGAAGCTA 


AATCTCCTTT 


TTTACCTAAA 


GTGATTAATT 


TCTCAACAAC 


2460 




ACTGCGAACT 


TCTTTTGCAC 


GAGCTTCTGT 


AGTTTCAATA 


CGTTCACTAA 


TAATAAGTGA 


2520 


10 


TGTAGCTAAG 


TCACGTAACA 


TAGCTTTACG 


TTGATCAGAA 


GTACGACCTA 


ATTTTCTGTA 


2SB0 


ACCCATGAGT 


TAACCTCCTT 


TATCAATCTT 


CTTTTCTTAA 


TCCTAATCCT 


AAATCTTCTA 


2640 




ATTTGTATTT 


AACTTCTTCT 


AAAGATTTAC 


GACCTAAATT 


ACGCACTTTC 


ATCATGTCAG 


2700 


15 


CTTCAGATTT 


GTCAGCTAAC 


TCTTGAACAG 


AATTGATTCC 


TGCGCGTTTT 


AAGCAGTTAT 


2760 


ATGAACGTAC 


AGATAAGTCT 


AATTCTTCAA 


TAGACATTTC 


TAATACTTTT 


TCTTTTTGAT 


2820 




CTTCTTCTTT 


TTCAATCATG 


ATTTCAGCGT 


TTTGCGCTTC 


ATCAGTAAGA 


CCAACGAAGA 


2880 


20 


TATTCAAGTG 


TTCAGTCATT 


ATTTTTGCTG 


CTAATGAAAC 


TGATTCTTGT 


GGTGTGATTG 


2940 




AACCATTAGT 


CCAAACATCC 


AATGTTAATT 


TATCAAAATC 


ACTGCTTTGA 


CCTACACGTG 


3000 




TATTTTCAAC 


AGTATAGTTC 


ACACGTTCAA 


CAGGTGAATA 


CAATGAATCA 


ACAGGGATTA 


3060 


25 


CACCAATTGG 


TAAATCACTA 


GTATTATTTT 


GTTCTGCTAA 


TGCGTAACCT 


CTACCCTTGT 


3120 




TAGCAACTAG 


ACGAATTTTT 


AAGTGACCAC 


CTTTAGATAC 


TGTTGCAATT 


TTAAGCTCTG 


3180 




GGTTTAAAAT 


TTCAACATCA 


CTATCATGTG 


TAATGTCGCT 


TGCTGTTACT 


TCGCCTTCAT 


3240 


30 


. CACGTACATC 


AATTTCTAAA 


GTTTTATCTT 


CTTCAGAGTA 


AATTTTCAAT 


GCTAATTGTT 


3300 




TAATGTTCAT 


AATAATTGTA 


GAAACATCTT 


CAACTACATT 


GTCTACTGCT 


GAGAATTCAT 


3360 




GTAAAACTCC 


CTCAATTTCA 


ATATACTTAA 


cGGCTGCACC 


TGGTAATGAA 


GATAGTAGGA 


3420 


35 


TACGACGTAA 


GGAGTTTCCT 


AGTGTAGTAC 


CGTAGCCACG 


TTCTAGTGGT 


TCAACAACGA 


3480 




ACTTACCGAA 


TTTAGCATCT 


TCACTAATTT CAATTGTCTC 


AATTCTAGGT 


TTTTCGATTT 


3540 


40 


CTATCATTTA 


AATATCCTCC 


TTATATACGT 


CGACTTAATT 


TAAAATGTTT 


GCTCAGTGAC 


3600 


CTGTAACAAT 


ACCATCATAA 


ATTATACACG 


ACGACGTTTT 


GGTGGACGAC 


AACCGTTATG 


3660 




AGGTACTGGA 


GTAACGTCTC 


TGATCGCAGT 


TACTTCTAAA 


CCTGCAGATT 


GTAATGCACG 


3720 


45 


AATAGCTGAT 


TCACGACCTG 


GACCAGGTCC 


TTTAACTGTT 


ACTTCAACTG 


TTTri'AAACC 


3780 


ATGCTCCATA 


GCTGATTTAG 


ATGCAGTTTC 


AGAAGCCATT 


TGTGCTGCAA 


ATGGTGTTGA 


3840 




TTTTTTAGAT 


CCTTTGAATC 


CTAATGCACC 


AGCTGATGAC 


CATGATAAAG 


CATTACCGAA 


3900 


50 


CTCATCAGTG 


ATAGTTACAA 


TAGTGTTGTT 


GAATGTTGAA 


CGGATGTGTG 


CTACACCATT 


3960 




TTCAATATTC 


TTTTTCACTC 


TACGTTTACG 


AGATACTTGT 


TTACGTGCCA 


TTTAAAATTT 


4020 
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CGCGCGTkGT TTTTCGTTTT TTGACCACGA ACTGGTAAAC CACGACGGTG ACGGATACCc 4140 

ACGGTATGAT GAAATTnCCA TTAAAcGTTT GATATTTAAG TTAGTTTCAC GACGTAAGTC 4200 

5 ACCTTCGACT TTATAACCGT CTACAACTTC ACGGATGCGA CCTAATTCGT CATCAGTTAA 4260 

ATCTTTCACA CGAGTATCAG CTGATACGTT AGCTTCTTCA AGAATTTTTT GAGCAGTTGA 4320 

CGTACCGATA CCGTATATAT AAGTTAATGA GATAACTACG CGTTTTTCAC GTGGAATATC 4 380 

10 

TACTCCTGCA ATACGTGCCA TATTAATTTA CACCTCTCTT TTATTAACCT TGTCTTTGTT 4440 

TGTGTTTTGG ATTTTCACAA ATTACCATTA CTTTACCTTT ACGTTTAATG ACTTTACATT 4 500 

15 TTTCGCAAAT AGGTTTTACT GATGGTCTTA CTTTCATTTT TATACCTCCC TATATTATGG 4560 

AGTGACGATT ATTTATAACG ATAAGTAATT CTTCCGCGTG TTAAATCGTA CGGAGACATC 4620 

TCAACAGTTA CTTTGTCGCC AGGTAGAATA CGAATGTAAT TCATTCTGAT TTTACCACTT 4680 

20 ACGTGAGCnA AAATCTCATG ACCATTTTCT AATTCTACTT TAAACATTGC GTTCGGTAAA 4 740 

GTATCTAATA CAGTACCTTC TAATTCAATT ACATCTTGTT TAGCCATTGA TTAACTTCCC 4 800 

CCTTTTTGCA ATAGTAAGGT AATCGTCAAT AGACAACTTT ATTGTTACGA ATCTATCAGT 4860 

25 GATTAATTTT ATAAGTTAAA CAAAAATTAC GGGAATTAAT TATCGTTAAT TGCCACTCTC 4 920 

ATCTATCTAA TATGATTAAA TCATGCCTCA CTTAAAATAG ACCGCTAAAA GTTGATCTAT 4 980 

TACAAATGAT CTAAAATATC AATGACATCT TTGGTAACGT CGCTAATATC TTTTGAACCA 5040 

30 

TCAATATTTT TCAATACACC TTTTTGATCA TAGAAATCTA AAATAGGCTT AGATTGTTTA 5100 

ATATTAACAC TCAAACGATT AGCTACCGTT TCAGGATTAT CATCTTCTCG TTGATACAAT 5160 

3S TTACCACCAT CGATATCACA AATACCT7CG ACTTCGGAGG ATTAAATACA AGATGATACG 5220 

TTGTACCACA TGACTCACAG ATTCGACGAC CTGTAAGACG GTTCATTAAT TCTTCTTCCG 5280 

GAAC3TCGAT ATTGATGACA GCATCAATGT TTCTGTCAAG CTCAGACATA ATATTATTTA 5340 

40 ATGCCTCAGC TTGCTCGATT GTTCTTGGGA AGCCATCTAA TAAAAAGCCT TTTTTTGCAT 5400 

CGTCTTCAGA AATTCTTTCC TTAACGATAC CTACAGTCAC TTCATCAGGA ACTAATTCGC 5460 

CACGGTCCAT ATAAGACTTA GCTTCTTTAC CTAATTCAGT TTCTTCTTTT ATAGCTTTTC 5520 

45 

TGAACATGTC ACCAGTTGAA ATGTGGGGTA TTGGGAATTT CTTGaCAATT TCACTTGCTT 5580 

GAGTTCCTTT ACCTGCGCCA GGTAAACCCA TCAAAATGAT ATTCATAAGT GCCCTCCTAA 5640 

AATTATCTAC CACCAAAGCC TTTATATTCT TTTTGAGATA CTTGAGCTTC TAAAGATTTC 5700 

SO 

ATTGTTTCAA TCGCTACACC AATAACGATA AGTAAACTTG TACCACCAAT CTGAATTGAT 5760 

TGTGGTAATC CCATAAACTT AGTTGCTAAT ATCGGTAGAA TTGAAATAAC GGCTAAGAAG 5820 
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CCAGGTCTAA TACCTGGAAC ATAGCTACCT TGTTTCTTAA GGTTATCAGC CATTTTTTCC 5940 

GGATTAACTT GTACAAATGC ATAGAAGTAT GTGAATAGTA TAATTAGTAC AATATATACA 6000 

ACCATACCAA CATTACTTGA AGGATTTGCA GCATTCGCAA TGTTTTGTGC CCATTCTTTA 6060 

TCTGGATAGA ACAACGTTAA TGTTCTAGGC AGTAAGAAGA ACGCCATTGC AAAGATTACA 6120 

GGAATAACAC CGGCTGAGTT CACTTTTAAA GGTAGATAAG TTGCCTGTGA ACCTAATCTT 61 BO 

TGAGCAGTTT GTTTCTTAGC ATATTGAATC GGAATTTTAC GAACGGCTTC AAGTACATAA 6240 

ATAGCACCTA CAGTTAATAG TATCAGTGAC ACTAAAAGTC CTAATACTTT CAACCATGCT 6300 

AATGATGTAT CTTCTTGCCC AACGAACGCA tTTGTcCAAA TTGAATTAGA CTGGCTGGCA 6360 

ACGTTGATAA AATACCCGCA AATATGATAA TAGAAATACC ATTACCAACA CCGAACTGAG 6420 

TGATTTGATC ACCAAGCCAT ATTAAGAAAG CAGTTCCTGC TGTnCAAAAC TAGTGCTATT 64 80 

20 AATAAATAAC TCATAATTGA CTGATTGATA ATCAGCGCAC CTTTGAGATA ATTATTAAAT 6540 

TGGAATGCCA TACCTATAGA TTGGATAAAT GCTAAAGAAA TTGCTAAATA ACGAGTAACG 6600 

TTATTTAACT TTCTTCTACC TACTTCACCT TGTTTTGCCC ATTCTGAGAA TTTAGGGACA 6660 

ATATCCATTT GTAATAATTG CATTACGATT GATGCAGTGA TGTAGGGTAC AATACCCATT 6720 

GCAAAAATAG AAAATCGTTT cAAGGCTCCG CCACCAAAAG TATTTAATAA CTCAGTGGCA 6780 

CCTTGAGAAC CTTGGGGATT ATCAAAAGCT GCAGGATTTA CTCCTGGAGC TGGTATATAA 6 840 

GTCCCTATTT TAAAAATTAC TAACATTGCT AGTGTGAAGA AAATCTTGTT ACGAACCTCT 6 900 

TTTGTTCTAA AGAAGTTCAC AAGGGTTTGA ATCATTAGAT CACCTCGTGT GcTCCACCTT 6960 

TAGCATCAAT AGCTTCTGCT GCTGAAGCTG AGAATTTATG AGCTTTCACT GTCAATTTCT 7020 

TATCAAGTGA ACCATTACCT AGTATTTTGA TACCAGATTT TTCATTCTTA ACAACACCAG 7080 

ATTCTACTAA TAAAGCTGGA GTTACTTCAG TACCATCTTC AAATTTATTA AGTTGGTCTA 7140 

40 AGTTAACAAT AGCATATTCT TTACGATTTA TGTTAGTAAA ACCACGTTTT GGTAAACGAC 7200 

GGAATAATGG TAATTGACCA CCTTCAAATC CTGGTCTTAC ACCACCGCCT GAACGAGCTT 7260 

TTTGACCTTT GTGTCCGCGA CCACTTGTTT TACCGTTACC TGTCGCAACA CCACGTCCAA 7320 

CACGATTGCG TTCTTTACGT GAACCTTCTG CCGGTTTTAA CTCATGTAAT TTCATTTCGG 7380 

CACCTCCTTG ATTATTTTTC TTCTACTGTT ACTAAGTGCT TAACTTTGTT GATTTGCCCA 7440 

CGAATAGCAG GGTTATCTTC AACAACTACT GAACTGTTAG TCTTTTTAAG ACCTAAAGCT 7500 

TCAACAGTTT TACGTTGTGT TTCAGGACGA CCAATAACAC TACGAGTGAG GGTAATTTGT 7560 

AATTTAGCCA TAACTAGTTT TCCCTCCTTA ATTGTATAAT TCTTCTACTG TTTTGCCACG 7620 
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CATGTTGATT GGTGTGTTTG ATCCTAATGA TTTACTTAAG ATATCAGTGA TACCTGCTAA 7740 

TTCAAGTACG GCACGAACAG GACCACCAGC GATAACTCCT GTACCAGGTG CAGCCGGTTT 7800 

CATAAATACG CTTCCTGAAC CGTAACGGCC AGTAATTGTG TGTGGAGTTG TACCTTCAAC 7860 

ACGTGGAACA ACTACTAAAT CTTTTTTAGC TGCTTCAACA GCTTTTTTGA TTGCTTCTGG 7920 

TACCTCTTGA GCTTTACCAG TACCGAAACC TACACGACCA TTTTTGTCTC CAACTACAAC 7980 

TAATGCAGTG AAACGGAAAC GACGACCACC TTTTACAACT TTTGCTACAC GGTTGATTGT 8040 

AACAACGCGT TCTTCAAATT CTTTCGTCTC TTCTTCtCTA CGAGCCATGT ATTTGTCCCT 8100 

CCTTTAAATT AAAATTCTAA TCCGCTTTCT CTTGCTGCTT CAGCTAATGC TTTAAcACGT 8160 

CCGTGATATA AATATCCTCC ACGGTCAAAT ACGATTTCTT TAATGCCTTT GTCAGCAGCT 8220 

TTTTTAGCAA TTGCTTCACC GACTTTAGTT GCTAATTCAA CTTTAGTTGC TGTAGTAGCA 8280 

ATGTCGCTGT CTTTTGAAGA AGCTTGAGCT AATGTTACGC CTTTATTATC ATCAATAATT 8340 

TGAGCGTAGA TATGCTTGTT TGAACGATAT ACGTTTAAAC GTGGCTTTTC AGCTGTACCT 8400 

GATAAGTTAG TACGAACACG AGCATGTCTT TTTAAACGCA CTTTATTTTT ATCAATTTTA 8460 

25 CTGATCATTT CAATACTCCT TTCTTTAGAG TTTATCTATT ATTTACCAGT TTTACCTTCT 8520 

TTACGGCGAA CGTATTCACC TTGGTAACGA ATACCTTTAC CTTTGTAAGG CTCTGGAGGT 8580 

CTTACTGAAC GGATGTTAGA TGCTAATGCT CCAACTTGTT CTTTTGAAAT ACCTTCAACT 864 0 

TTAACGACTG TGTTTTTCTC AACTGAGAAA GTAATGTTTT CTTCAGCTTT AATTTCTACT 8700 

GGGTGAGAAT AACCAACGTT AAGGATTAAG TCTTTACCTT GCATTTGAGC ACGGTAACCT 8760 

ACACCAACAA GTTCAAGTAC TTTTACGTAT CCTTGAGAAA CACCTTGTAC CATATTGTTT 8820 

AATAAAGCAC GAGTTGTACC ATGGTTTGTT CTATCTTCTT TAGAATCAGA TGGTCTTACA 8880 

ACTTCAATTG TGTTTTCTTC TTGTTTGAAT GTCATTCTTT CATTTAAAGT TCTTGATAAT 894 0 

TCACCTTTAG GACCTTTAAC AGTTACATGA TTTCCATCAA AAGTTACTGT TACGTCACTA 9000 

GGGATGTCAA TAATTTTCTT ACCAACACGA CTCATGTTAT GGCACCTCCT TATTTTTTAT 9060 

TACCAAACGT ATGCGATAAT TTCTCCACCA ACATTACGTT TTCTTGCTTC TTTGTCAGTG 9120 

45 ATTACACCTT CAGAAGTTGA TACTAATGCA ATACCTAAAC CATTTAATAC TTTAGGCATT 9180 

TCGCTAGCTT TTGCATAAAC ACGTAAACCT GGTTTTGAAA TACGTTTTAA TCCTGTGATA 9240 

ACACGCTCAT CGTTTTGACC ATATTTTAAG AATAAACGAA GTACACCTTG TTTATCATCT 9300 

TCTACGTATT CAACATTTTT AATGAAACCT TCACTCTTTA AGATTTCAGC AATTTCTTTT 9360 

TTAATATTTG ATGCAGGTAA TTCTAACTTC TCGTGACGCA CCATGTTTGC GTTTCTTACA 9420 
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TCTTTTTTAT TACCAGCTAG CTTTACGAAC GCCAGGGATT 


TGGCCTTTGT 


AAGCTAATTC 


9540 




ACGGAAACAA ATACGGCATA 


ATTTAAATTT 


ACGATATACA GAATGTGGAC 


GGCCACAACG 


9600 


5 


TTCACAACGA GTGTATTCAC GAACTGCATA TTTTTGTTTT TTTTGTTGCT TAGCAACCAT 


9660 




TGAAGTTTTA GCCACTTAAT 


TAGCCTCCTT 


TAAATAATTA 


TTTACGGAAT 


GGCATACCGA 


9720 


10 


AGTTAGCTAA CAATT CACG A 


GCTTCTTCAT 


CAGTGTTAGC 


AGTCGTTACG 


ATAACAATAT 


9780 


CCATTCCTCT AACTTTACTT 


ACTTTATCAT 


AGTCGATTTC 


TGGGAAAATT 


AATTGTTCTT 


9840 




TAACACCTAA AGTGTAGTTA 


CCGCGTCCGT 


CAAATGCTTT 


TTTAGAAACA 


CCTTGGAAGT 


9900 


15 


CACGTACACG TGGTaATGAT 


ACTGAAATTA 


ATTTGTCTAA 


GAATTCATAC 


ATTCTTTCAC 


9960 




CGCGAAGTGT TACTTTCGCA 


CCGATTGGCA 


TACCTTCACG 


TAAACGGAAA GTCGCGATTG 


10020 




arrrriTAGc tttagttact 


AATGGtTTTT 


GACCAGTGAT 


CAATTCTAAT 


TCTTCAACAG 


10080 


20 


CATTGTCTAA TACTTTAGAA 


TTTTGTACTG 


CGTCACCTAC 


ACCCATGTTC 


ACAACGATTT 


10140 




TATCTATTTT TGGTACTTCC 


ATTACTGAAC 


TATAATTGAA 


TTTTTTCATT 


AAGTTTTCAG 


10200 




TAACTTCAGT GTTaAACTTT 


TCtTTTaAAC 


GGTTCaAAGT 


GGGATCCTCC 


TTTCaACTTG 


10260 


25 


TtATTAATTA TTAGAkTTAA 


TTTCTTCGCC 


AGATTTTTTA 


GCGATACGAA 


CTTTTTTACC 


10320 




ATCAACAAAT TTGTAACCTA 


CACGAGTTGG 


TTCGTTTGTT 


TTAGGGTCCA 


ATAATTGTAC 


10380 


30 


ATTAGAAACA TGGATTGCTG 


CCTCTGTTTC 


TAAGATTCCA 


CCTTCAGGAT 


TTAATTGAGT 


10440 


TGGTTTTTGG TGTTTTTTCA 


TAATGTTAAC 


ACCTTCCACA 


ACGACACGGT 


CTTTTTTAGG 


10500 




TAGAGTAGCA ATTACTTTAC 


CTTCTTTACC 


TTTGTCTTTA 


CCTGCGATAA 


CTTTAACGTT 


10560 


35 


GTCACCTTTT TTGATATGCA 


TGTGGGCACC 


TCCTTATTTG 


TATTGGTTGT 


TATTAATTAA 


10620 




AGTACTTCTG GTGCTAATGA 


TACGATTTTC 


ATGAAGTTAC 


CTTCACGTAA 


TTCACGAGCA 


10680 




ACA<^TCCGA AGATACGAGT ACCACGTGGG 


CCTTTGTCAT 


CACGGATGAT 


AACACATGCA 


10740 


40 


TTTTCATCAA ATTTGATGTA 


TGAACCGTCA 


TTACGACGAA 


CACCTGACTT 


AGTACGTACG 


10800 




ATTACAGCTT TGACAACGTC 


ACCTTTTTTA 


ACAACGCCAC 


CTGGTGTTGC 


ATTTTTAACA 


10860 




GTACATACGA TAACATCGCC 


GATGTTTGCT 


GTTTTACGAC 


CAGATCCACC 


TAATACTTTG 


10920 


45 


ATTGTAAGAA CTTCACGAGC ACCAGAGTTG 


TCTGCTACTT 


TCAAGCGTGT TTCTTGTTGG 


10980 




ATCATTAGTT AAACCTCCCT TATCTCTAAA CTTGTATTAA ATAATTACTG ACTCTTCAAC 


11040 


50 


AATCTCTACT AAACGAAAAC 


GTTTTGTTGC 


TGATAAAGGA CGAGTTTCTT 


GAATTTTAAC 


11100 


AATGTCTCCT AATTTAGCTG 


AATTGTTTTC 


ATCATGAGTT 


TTGTATTTTT 


TAGAGTATTT 


11160 




TACTCGTTTA CCGTATAATT 


TGTGTGTTTT 


GTAAGTTTCA ACAAGTACTG TAATAGTCTT 


11220 



55 



928 



EP0 786 519 A2 



10 



15 



20 



25 



30 



35 



40 



45 



50 



TTTTGTAACC 
CGAGCAACAG 
TCTAATTGAC 
ATTTGTTCTT 
ACCACCCAAT 
ACGTAGTGcT 
TGGTTTAACA 
TAAAGGTTTT 
TTTCATGTAA 
CGTTGTTGTA 
CCAGTTGTTT 
ATTTTCCTCC 
TAACGCCTAA 
GTAACGTATG 
CGCCTAAACG 
TGATTGCTTG 
TTTCAGCTAC 
CTTTTTTATC 
TACCAATTAC 
GTTCAATCTC 
TTTTTAAATC 
AATCACGGAT 
CTCCTTAAAA 
AATGTGGCTT 
TTTTAATGTT 
GTCATAGTTA 
TGAAGCTTTG 
TAAGTCAAGA 
TGCTTCCATT 



TCCTCTTACT 
TTTTTAGACG 
CTGTAGCTAA 
CGATTTCTGA 
TCCTCACGTT 
TCACGCGCAA 
ACTGCGATCC 
TTAGTATATG 
CGTGTCATTG 
GCTTGTAAAC 
TAGGACGATG 
TCCACTAGTG 
TTTACCGTAA 
AAGTGGAACA 
ACCAGATACT 
TTTTTGTACA 
TAAACGAGCG 
AGTTAACGCA 
CATACCAGGT 
TACGTGAGAA 
TTCGTGTAAA 
AATACCAACA 
GTTAATTAAG 
GTACGTTTGT 
GGTCCTTCGT 
TGTTCAGCAT 
TTTGTTAATT 
ACTAGTCTTA 
AGGATGTCCT 



TAATTATTGA 
TGCAATCGTT 
CTGAAAGCGT 
AGTGGTTAAG 
TTACAAACTT 
CTTCTTCAGA 
AGCCTTCAAC 
GTGTATGTGG 
CTATACGAGC 
CAAACTCACC 
TTGACGACGA 
TTCTTAGTAG 
GTAGTGTCAG 
GTTCCTTCTG 
TGaGTTTTGA 
CGACGGAATG 
TCAAGATCAA 
TTTAATTTGT 
TTACCAGTAT 
ACTGATGCTT 
AGTGAAGCGA 
CGAAGTCCGA 
CTTCTTTAGC 
TAATCGCACT 
TAGCATATGC 
TAGCTAAAGC 
TTAAAATTGC 
CTTTACGAGG 
CCTCTACTTA 



TTAGCCTTAC 
TTTCTTACTG 
AGGTTAAAAA 
TCTCTAATTT 
AGTTTTTACT 
AACGCCAGCA 
CGCACCTTTA 
GAAGATTTTA 
AGATTCGATT 
AAATGTTACG 
TATTTTACAC 
GAAGAACTTC 
CTTCAGCGTG 
AATATTGTTC 
TACCTTTAGC 
AAGCACGGTT 
CTTTTTTGAT 
TGCGTAATTT 
GAATTGCAAT 
CTTTTAATTC 
AGTCTTTTTC 
TTGGATTAAT 
TTCTTCTTTA 
TGCACGACCT 
TTCTTTAACT 
GGACATTAAT 
AATAGCTTCA 
TGCGATTCTT 
ATAGATATTA 



TTTGTTCAAT 
TACGAATACG 
GCTCTTCTTT 
CCTTAGCTTT 
GGAAGTTTGT 
ACTTCGAATA 
CCAGCACCCA 
ATCCAAACTT 
TGACGAGATG 
TAtTACCGCC 
GTTTTGGTAG 
TCCACGATAA 
tGCATAATCG 
AGCACGAGCG 
ACCAAGTTTC 
TTCTAATTGA 
TTCAATTACG 
TTCGATTTCT 
GTTGATACGG 
ATTATCAATA 
AGCATACCAT 
TTTTTGACCC 
CCGTCACTTA 
TGCGCACGTG 
ACTAATTCAT 
ACTTTTTCAA 
GCAGCATTTT 
ATTGTTCTAG 
TCTTCTTGTT 



TTCTCTTTCA 
TGCAGTTTCT 
TGAAGATTTG 
CATTTGTTTC 
GACTTGCTAA 
AAATTCTACC 
TACGTACTTC 
TCCCGCCACG 
TGATCCAAGA 
TTTAGAACGA 
TAACATTATT 
ATCCATACTT 
ATGTCAGCAC 
ATGTCAGCTC 
ATAGCTCTAG 
CGTGCGATGT 
TTGATGTGTA 
GAACCGCCTT 
TTTGCAGCAC 
AATTTACGGA 
TTAGCTTCCC 
ACAGTATTCC 
CGACGATTGT 
GACGGAAACG 
CTGTGTTCAT 
TTACTGGTGA 
TACCTCTGAT 
CAACCGCTTT 
TTCTTGTCGT 



11340 
11400 
11460 
11520 
11580 
11640 
11700 
11760 
. 11820 
11880 
11940 
12000 
12060 
12120 
12180 
12240 
12300 
12360 
12420 
12480 
12540 
12600 
12660 
12720 
12780 
12840 
12900 
12960 
13020 
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TATCTTCAGT 
CGATGAAATT 
CGCTTCCTTC 
TAATACTACG 
ACACCCAAAT 
ATGATTTTTT 
GAGATGGTCT 
TCATTACAGA 
CAACGTTAAC 
ATAAGATCAT 
CAAGTACTTG 
GCTCGATGTT 
CTTTGATGTC 
CAATGATATA 
TTGGATCATA 
CGATAACACG 
GGTTGTTACG 
TCGTGATTTC 
ACTTTTTAAT 
GTCGATTGAT 
GTAACGGCCC 
TACGTTGAAG 
GTCGAAAGTG 
CTTAAGAATA 
TCAGTAATTA 
GTCACTTGAA 
GTAACTACTA 
GTTTTTGGAG 
AAAGATAATG 



TACATATACA 
AGGGAAAATT 
TTGAGCTTCA 
AGCCATTTGG 
AAGTTGATTA 
ACCACGACGA 
ACCGATAGGA 
ACCACGAACT 
TAATTCGTGT 
ACGAACTTCA 
AGCACTTGCA 
GTGTACTACT 
AGCTTCAGCA 
TCGTTTTTCA 
TTGAATAGAA 
GTATTGACGT 
TCCCGCTTTT 
TGCGAAATCT 
AGCCATTGTC 
CCTTCTTTAA 
ATACGTTTTT 
ATTTCTTCAA 
TATTTGTCTT 
TCTCTTGCTT 
CTAAGCTGTC 
CGCCAGGGAT 
ATACTTTTTT 
CTTCGAAGTT 
CTGAGCGTAA 



GGTACGTGTT 
GTAGAACGAC 
ACTnTTTCA 
GCGCCTCCCT 
TATTATTTTT 
GTTTTCTTAC 
GCACGACCTT 
GTTGGACGGA 
TGTAGGTTAC 
CCAGATCTTA 
CCAGCTGAAC 
GTACCAACTG 
CCACTTTCAA 
CCGTCTGCAT 
TCAACTTTTG 
TTGTGTCCAC 
TTCGGTAGCG 
AACGAaGTCA 
GCTTACCTCC 
GAGTTACAAT 
TCTTAGGTTT 
CTGCCATTTT 
CAGCCATTGC 
CCATTATCCG 
AGCATTAGTG 
GTTGCGTGCT 
AGGTTGTTCT 
GAATGCGTCA 
AGCTAAACGA 



TACGTCCGTC 
GTGACCATGT 
TTAAATGCTC 
TCTTATTATG 
TCTTACGTCC 
CAAGCGTAGG 
CACCACCACC 
TACCTTTCCA 
CAACTTGACC 
ATCTGATTAA 
GAGCGATTTG 
GAATGTTTTG 
CGATTTGACC 
ATACAACTAA 
CATTGATACC 
CACCATGGTG 
GTTTTAATAA 
TATTACGACG 
TTAATGGTAA 
CGCTTTTCTT 
GTAATTCATG 
TACTTGTGTT 
TTCAGAAGAT 
AGCACCTCCT 
ATATCTAAAA 
GATAATTCAA 
AATGTAGATA 
ACTACAGTTA 
CGCATTTTCT 



GTATACTGCA 
TTTGATTACT 
ATCGACGAAA 
TGCGTGCAGC 
ACGAACGATA 
TTTACCCCAT 
GTGTGGGTGA 
TCTTGAACGT 
GATTGTAGCA 
TACGTATTTA 
TCCACCTTTA 
TAATGGTAAT 
TACTTCTAAT 
AGCGATGTTT 
ATCTTTGTTA 
TCTTACAGTC 
TGACTTTTCA 
ACCATTTGTT 
TTGTTTTATT 
CTTTTGTTTG 
ATATTAACAC 
TTGTTAACAC 
TTCTCAGTGA 
CAACTTTTTT 
CATTTAAACC 
CATTTACATC 
ATACATTTTT 
AGCCATTCTC 
TAGGCATTTT 



AAAGTATGTC 

TGTTTCTTTT 

GGTCCTTTTT 

TTTAAGCCGC 

AGTTTGTCTG 

GGTGACATTG 

TCGTTAGGGT 

CCGGCTTTAC 

CGGCAAGTAG 

CCTTCTTTAC 

CCAGGTTTAA 

GCGTTACCAA 

CCTTTAGGAG 

GCTGAGCGGT 

CGTTTGAAAT 

AATTTACCTT 

GGTGTAGTTT 

ATTGGCTTAT 

AGTTAAATAA 

TATAGCCTTG 

TTGCAACTTT 

GAGTATCAAC 

TTACGGGGCG 

AGCAGCAGCT 

TTGAGCAGTT 

TTCGTTTTCA 

GAATTCTTTA 

TTGAGCTTTG 

GTATGCATAA 



13140 

13200 

13260 

13320 

13380 

13440 

13500 

13560 

13620 

13680 

13740 

13800 

13860 

13920 

13980 

14040 

14100 

14160 

14220 

14280 

14340 

14400 

14460 

14520 

14580 

14640 

14700 

14760 

14820 
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CCTTGACGAG CACGACCTGT TCCTTTTTGC TTCCATGGTT TACGTCCGCC ACCGCTTACT 14 940 

GCTGAACGAT TCTTAACAGC ATGCGTACCT TGACGTAATG AAGCACGTTG TAAATTAATA 15000 

5 

GCTTCGAATA AAACGCTATT ATTTGGCTCA ATACCGAATA CTGCATCGCT TAATTCGATT 15060 

GAACCTGATT TAGTTCCGTC TAATTTTAAA ACATCATAAT TAGCCATTAT GCATTTCCTC 15120 

CTTTCACTTC TTATTATTTA TTACCTTTTT TAATTGAAGT TCTGATTTCT ACTAAACCTT 15180 

10 

TTTTAGGTCC AGGTACGTTA CCTTTTACTA AGATAACTTT GTTTTCTGTG TCAACTTGAA 15240 

CTACTTCTAA GTTTTGAACA GTTACAGTGT TTCCACCCAT ACGTCCTGGC ATTTTTTGGC 15300 

15 CTTTAAATAC TCTAGAAGCA TCTGAAGCCA TACCTACAGA ACCTGGTGCT CTGTGGAAAT 15360 

GAGAACCGTG TGACATAGGT CCACGAGATT GTCCGTGGCG TTTAATTGCA CCTTGGAAAC 15420 

CTTTACCTTT TGATACGCCT GTTACGTCAA TAACGTCGCC AGCTACAAAA GTATCTACTG 15480 

20 AGACTTCTTG AaCCTAcTcG TAAGCATCCA CGTCTACATT GCGGAATTCA CGAATGAAGC 15540 

GCTTAGGTGC TGCGTCAGCT TTTTTAGCGT GACCTTCAGC TGGTTTATTA GCATATTTAT 15600 

TAGATTTTGC ATCTTTTTTG TATGCTTTTT TGTCTTCAAA TCCAACTTGG ATTGCGTTGT 15660 

25 ATCCATCAAC TTCTACAGTT TTCTTTTGTA ATACAACATT TTCTTTAGCT TCTACTACTG 15720 

TTACAGGGAT TAATTCACCG TTTTCTCCGA ATACTTGTGT CATCCCAATT TTTCTTCCTA 15780 

AGATTCCTTT GGTCATCGAA AGTCCACCTC CTAAAATTGT CTATTATAAT TTGATTTCGA 15840 

30 

TGTCTACACC AGATGGTAAG TTTAAGCCCA TTAAAGCGTC AACTGTTTTT GGTGTTGGGT 15900 

TTACAATATC GATTAAACGT TTGTGTGTAC GTTGTTCGAA TTGTTCACGT GAATCTTTAT 15960 

ACTTATGCAC GGCACGGATG ATTGTGTAAA CTGATTTCTC AGTTGGTAAC GGAATTGGTC 16020 

35 

CAGAAACATC TGCACCAGAA CGTTTCGCTG TTTCTACAAT CTTCTCTGCT GATTGATCAA 16080 

TTACSCGGTG ATCATAAGCT TTTAATCTGA TTCTGATTTT TTGTTTTGCC ATAATTTTCC 16140 

40 CTCCTTATTC GTCTACATTT AGTGATAGAC TTCTCCACGA AAACTATCTT ACACAGCGCC 16200 

ATGGCAAAGC GGCCGGGTGT GTCAGTAACC TTTCGCTTCA TCGCTTTTCT TAAAGTCCAA 16260 

CGTTAGTTAT ATTACACGAA AAACATCGAT AAATCAAGGC TTTTCACATA ATTTTTCTAT 16320 

45 CTGTCTAACA CATACTTTTA TATTTnACTT TATATACTTA GTCAGTTCAA CTATTTTCGA 16380 

GATATTTTnA ATTTCCn 16397 
(2) INFORMATION FOR SEQ ID NO: 206: 

50 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 29555 base pairs 

(B) TYPE: nucleic acid 
(CJ STRANDEDNESS: double 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 206: 



70 



15 



30 



35 



50 



TnAGTTGTTT 


CTGCCACGAA AGATTCAATG 


G CTTTTPTTP. 


fTTT A PfJPTT 
^111 n^-VJV* 1 1 


1 1^1 1 1 


Q U 


GGCAAATCAC 


CAATCATTTT 


TTTAAGGTGA 


XVJXVJVJVJI 1 ia 


PA APAPPAPT 
^-ttnv»n\_.*»AL. 1 


ft T* A PTfyiT A P. 
Al AG iwlMu 


ion 


TCATTTGAAn 


TTGTTTTTAG 


GGCTTGTTCA 


TPP» AT AP. A TP 


1 1. 1 1_ 1 V.GAGG 


ft a aTPPTTTr 
AAA! GG 1 1 1G 


lou 


AAPTPPGPTT 


CTTTTTTAAT ACTTTCGAAA 


TTA APATATT 


P'f['(^ 1TPP1T 

Gil GA I GG AT 


ATGATGAT GG 




XT A TTT A A A P. 
x a x x i/tnnvj 


AAGGTACAAC 


ATTGTCGATG 


ft ft^P^Pr "■■^^'I'ft ft 
AA1 


TTAGATCTCG 


TTTTAACCTC 


*3 A A 
300 


AATPit PGP. AT 


CATCTGCATG 


ATCTAAAATG 


tulLlMl 1 1 


GTTCTTGGTT 


ft PP ft Pf **l*My T 

ACGACGTTGT 


1 £ f\ 

360 


T p PP.P TTTftT 


CTTCAAGATC AATTTGTCTC 


ft ATRTA 'P'PPft 

AATATATTCa 


TAATATAATT 


CACATTAATC 


420 


ulnl Un 1 1 Al« 


GCATCATTTC 


TATTTCGAAA 


TP ft &TRTPH T 

1 LAAXAi GA1 


TTR H A ftTPP7\ 

1 iaaaatgga 


TACTTTATTT 


480 


TTPTP ft.P.PPP. 
X id LAwl_l_W? 


TCGCTCTTTT 


TACTTGATCG 


TRPfcPRPPTR 

I AGAGAGGTA 


AATATTTACT 


TTTATAGTCT 


540 




GTTCATCCAT 


TCCAATTTCA 


1GAA1 luiAA 


A ptp ft ft ft pt*p 
ACTCaaagTC 


GTCAAATGCT 


600 


111 AAALV? X ri. 


ATATTATTTT 


AGCTAATAAA 


GGAlAAGGt I 


GAAgAAAGCG 


CTTTAGCTCT 


660 


tpttpatp*' t 1 

1W11 v»~rll l»tl 


GaATGtCATC 


AACCATGTGT 


pp TP'TPPiP P A 


CAATCATTTT 


ft ft p pmp ■» /*v n 

AAGCTCACGA 


720 


TAAGCGTCCA 


TAAATTCTTT 


TTTATACTCT 


1 LA 1 GG 


PPHTTR R ft ft T* 

GgATTAAAAT 


TPT ft TPPPT ft 

TGTATCCGTA 


780 


TCATTTGTTT 


GTGAGAATAC 


1L1 GAG J/GGA 


TPPTPTPTPT 

1 GG X G lb 1 V- 1 


Li 1 1 1 1 1GAA 


PTPft PPftTftP 

G 1 GAGGA TAG 


84 0 


TTTACAATTT 


TACCAAATGG 


CTTTGATTCT 


TTTTra appp 

1X11 LAAGGG 


T ft TTTPTR Pp 

1 Al X XG X AGG 


TP ft ft T^ft pppT 

1 GAATAGGCT 


AAA 

300 


TGAATTAAAT 


CATGATACAT 


TAAATTCTTA 


TPAAPATATA 


A Rr,Tr.TTP AP. 
AAVj 1 Vj 1 1 LAG 


ft ft f i " ft 
1 AG 111 AG 1 A 




TCAAAACCAG 


TTAAGAACAT 


ATTAACAACG 


ATTAAHATAT 
nx XAnunlnl 


Win 1111 nU 1 


nlUl 1 1 nnLu 


1 \JZ It 


CCCTTTTTAA 


CGTTTTTtGA 


AATATGATTA 


AAATAPTCAT 


xno i iuwww^ 


TfinTHa AAA A 
1 VJi 1 1 OClnnnn 


1UOU 


TTCGTCTCGA ACTTTTTATT 


ATAATCACTA 


ATPATTATPT 


PT A ATTTTTP 


A CCiTd A ATP. A 




TATGGCACTT 


CACCATCACG 


ATCATCTTCA 


TTAGGTTTAA 


APGTAAATAT 
nwU; 1 nnnlnl 


A PP AfJPT ATP 


l&UU 


GTTAACGGTT 


GTTCCAACTT 


TTTGTTAAGT 


CGCTTAAATG 


TCTCATAATA 


TTTAATAAGC 


1260 


GCGTGAATAC 


TTTGGACTGT 


AAATATACTT 


GAATATTGAC 


GATTACGTGT 


ATATTTATCA 


1320 


TGATTATTGA 


TGATATGTCG 


TGTTACTAAT 


TCCACACGTT 


TATCCGCTAA 


CCATACTTCT 


1380 


TCCGTATCAA 


TTGCTTCAAC 


CATGCtGTTA 


TCTTCTGCTT 


TTAAAGCTTT 


ATTTTTAAAA 


1440 


GTATTAATAT 


AGTCAACTGA 


GAAACCAAGT 


ACATTACCAT 


CATGAATGGC 


ATCTCTAATT 


1500 


AAATACGTAT 


GTAAGCATCT 


ACCGAAAATA 


TCTGCAGTTG 


TTCTACCATC 


TTGACTACTA 


1560 


TTTTCTGGAA 


AACGTGGCGT 


ACCAGTGAAT 


CCAAAGTATT 


GGGCATTTTT 


GAAATGTTGT 


1620 
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ACTTTATTCG TTTTATACTG TTCTAATAAA 
TTTTGAATCG TCGTTACAAT AAGTGGCAAA 
5 GAGGTATTAA AAGTTTTGTC TACAGCACCC 
TGACTATCCA AGTCTTTACG GTCAACCAAA 
GATAAAATCT GACTCGCTTT AAAAGAAGTC 

10 

ACATATCCAT TATTCCCTGT CTCAGTCGCT 
TGATACGGAC GCATTGCCAT CAGTATTCTA 
ATCATCTTAG CTAATTGACA AGGTCTCATA 

15 

ATACGGTTAT TCTGTTTATC ACTCCAATAA 
TTATTAGAAA AGTATCGCGT TTCAACACCA 

20 AATAAGCCTG TGTAATTTTG TTTGCGGTAA 
TCAATACCTC GACGTTTCAA TTCAACTTGG 
ACATCATAAC GTGCTTTATA TGTATCCTCG 

25 TTTTTACACC AACTTTTCGT ATCTAAAAAC 
CTAAGTGGTA ATTTATCACG TAAAATACGG 
ATCGTTAACA GACGTTGaAA TTCTTTATCT 

30 

TGACGCTCAT TTAAAATCGT TCTAAAATTA 
ACTCTTTCGT AACCCAATTG TTCAAGTTGA 
CTTTGGTATG CCATTCATAT CCCCTTCCAT 

35 

ACTTTAATGA AAAATGTTTG TTTTTTATCT 
CTTATCTTTT AATATTTGTC TTTGAGGTAA 

40 CAAATCATTG ATAAATTTTT TGTCTACGAT 
CTATCAAATC ATTTTATTTT TTATTATTAG 
CATGGCAGTC ACTGTAGGTA ACTTCACTTC 

45 TATGTACTAC TACCTACTCT ATAAAAGTCC 
TTTCATTCAT ATCACTAATT TGATAATAAT 

AGCATTAAAA TTATTCTTCA GCATTTAATT 

SO 

TGAACTTTGC TTTAATTTGT CACGCCTTTA 

TACAAACTTG TAGCAACAAT TTTTCATCAA 

SS 



GGGGCATTCC CTTGAATCGC TTTAGCCATT 1740 

CTTTTATCAT TTAGTTGGCG TACCAGTTGC 1800 

TTAGCAAATT TATTAAATTC CTCTTCTGTT 1860 

AAGATAACTT TCTTAATGTC ATCTTGCTGT 1920 

AACGTCTTAC CACTTCCAGT TGTATGCCAT 1980 

TGTTGAATAA GTGCTTCTAC CGCATACACT 2040 

TCTGTTTCAT TAATAATCAT ATAGCGCGAT 2100 

AATGACTCAG CAAACGATTG CAATGTATTG 2160 

AACATGTGAC TCITCAATAG TTCGCTATCA 2220 

TTACTAATGA TAAACATTTG TATGTAGCGG 2280 

CGTTTTACTT GGTTAAACGC CTCATTAATA 2340 

ACAAGGGGTA GTCCGTTGAT TAATATCGTT 2400 

ACAGATACTT GATTCGTCAC TTGAAACTTA 2460 

GACAAATAAA TCTCAGACTC ATCATCACGT 2520 

GCACTCTCGA AAATACTTTT TCCATCAATC 2530 

GTTAaGGGAT TGCCTTCTAA TTTGTCCGCA 2640 

TCAAGCAATT GCTTATTATC ACGTATCGTT 2700 

TTCATCATTT CATTTTCTAA TGCGTATTCA 2760 

ACACTTTCTA TTGCTCTAAA TATATCATAA 2820 

TCAAACGTAA ATTTATTCTA ATTTTATTGT 2880 

GTCGTATACT AAAATTTGAA TACAAATAAT 2940 

TAATGGAGGG ACTTGAATGG TGTTAATTAC 3000 

TCTAAGTTAC TATTTAACTT TAAATCATTA 3060 

AATATTCGGC ATGTTCGCAG CCATACTCTT 3120 

CGAATACAAT CAACGCAAAC GATTTAAACA 3180 

TGCTTTTAGC ACCTTCGTAT TAGTTCATTT 3240 

TCCATCTATG AAAAAAGCAA AGCTCAAATC 3300 

TCATTTTCAA AATAGCCTCT ATGCCAGTTT . 3360 

GCAACTGAAT CACATCAAAA ACTTCAATTG 3420 



933 



GTCGCAAGAT GCTTCCTGTA ATTATCAAGT 
ATCGCATGAT AATTTAATGC TACAAATCGA 
5 GCAAATAGTG ACGTTGTAGC CGCCATACGC 

AATGCATAGT CTGCAATTTG AGCCACTGGA 
GGAATACTGT AATGTGTGGC CACCTGTGCA 

10 

TTCGTCACAA AAATCATGCA ATCTCTATCA 
TGCGTTTCAT GTAATAACCT GACATTTAAG 

15 CCAATAGTCA AACTCGATGC GCCAAATCCA 

ACATCACAAA TTGCATCAAT TTGCGCATCC 
TTCGTTGCTC TAGCAATCAT TTTATTTTTC 

20 TCTAAATGTG GATTGGTTGC AATATCTTCG 

TCTTGAAAAC CTTGATGTGT CATTTTCCGA 
TTCGTAACAT CTGCCAAATC ATTCACAGTC 

25 ATGTAATCAG CGATTATCTT TTCTGTCTTC 

TATAAAATAT TTGTCATCAT TAATCACCCA 
TTCCAAATAA ATATGTACAA ACGAATCCAC 

30 

AACCTAAATA CATATTATCT GAGATTAATG 
CTTTGGCACC AATATGTCCA ATTCCACCTA 
AAGCAGTTAA GAAAGGTCGA CCTAATGGCA 

35 

TACCTAGGAA ACCAACTGGC AATGCACCTT 
TACATCTTAC CCAAAGTGCT AATGCGGCAC 

40 TTGGCAATAA GTAAGTAGCA CCTGATTGGT 

TATGATGAAG CCCTAACATA ACTAACGGTA 
ATACGCCACC AATACTAATA ATTCCGTTAA 

45 CTGCTAATGG CATAAAGATA AAGATAGTTA 

GCGTTACAAT AATATCAATC GCATTTGGCA 
TTAAAATCCA AACGGCAAAA ATAACGCCAA 

50 

CTCCAGTGAA GACATTCATT AAAATATTTT 
CACCAATCAC GCCACCAAGT CCTGGTGTCG 

55 
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G CCATTTT CG ATTGGGTTAT ACAATCTAGA 3540 

TAGTACAATA TATCTACCGT GAATAACTGT 3600 

ATTTCATTTT CATCAGTTCT GCCATAAATC 3660 

TTATTAGCTG TACTAGATAT AGTTATGATG 3720 

ATTGACTGCA ATTCACTATG ACTACCTTGA 3780 

TCATGCGTCG CAAATGTTGA CACAAGTAAA 384 0 

CCAATACGAG ATAACTTTTG AAAAAGATCA 3900 

AATAAAAATA TTGTCCTGGc ATTTTTCAAC 3960 

ATAATATTAG TAGCTACAAA TCGCATCGTA 4020 

AAAGTTTCTA CAGATTCATT TTCAATCAAT 4080 

GGTAAGTATC GAGATATCGC AATCTTTAGC 4140 

CTAAATCTAA CAATTGATGC TGTACTAACA 4200 

ATATCAATGA TTTTATGTGG ATTCTTTAAA 4260 

GTAAAATCAC TCAACTGCTT ATCAATGCGA 4320 

ACAAATCTGT CTGTCGCATC GCCTTTGTCG 43 80 

CAGCATACGC AGCAAGTAAT CCTGCAATAT 4440 

GTAATAGTGA CACACCACTT GGGCCTATTG 4500 

TTACAGCGCC ACCAATACCA CCACCAATAC 4560 

AAGTCACACC ATAGATTAAT GGTTCTCCGA 4620 

TTAAAGTATT ACGTAATGTT GTGTTGCGTT 4 680 

CTACTTGTCC AGCACCAGCC ATCGCTGCAA 474 0 

TAATCATTTC TATATGAATT GGCGTAAAAA 4800 

GGAAGCTTGC ACCAATGATA AATC CACTAA 4860 

CTACTGAAAC TAAACTGTCT GAAACAAAAC 4 920 

ATAGTCCTAC AATCAACAAT GCAATAGTCG 4 9 BO 

CAATTTTATG TAATCTCTTT TCGACAATAC 5040 

TAATCCCACC TTGTCCAGGT TGCAATGGTT 5100 

TACCAGCAAT ACCCGTTAAT AACGTTGTAC 5160 

CACCAAATTC TTTAGCCGCA TTAATACCAG 5220 
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GCGTAATCCA AGCACCTGAA ATATAGCCTG CCACCATTAA GTTACTCAGT ACTGCTGCAA 5340 

TACCACCAAT TAATCCAGCT CCAATAAATG CAGGAATCAA CGGTATAAAG ATATTGGCAA 5400 

TTGATTTCAA TACTTTATTC AACTTACCAT TCTTTTGTTT TGCTTTATGC GCTTCCTTAT 54 60 

TCGCCTTTGC TTTATCAGCT GCATATGATT TATAGTCCAT TTTTTCACTA TCATTGTGAT 5520 

GGTGTGGTAT TGGGTCACCT AGTTTAACAC CACTTAATTC CGCCATATGA TTAGCCACTT 5580 

TATTGatGTA CCAGGTCCAA CCACAACTTG AATGCGTTCA TCGTGTATAA CACCCATGAC 5640 

ACCATCAATA TGCCTTAGTT CTTGGTCATC TACTTTATTC TCATCTAATA CTTTAATACG 5700 

CACACGTGTC ATACAGTTCA TGACACTATC TATATTATCC ATACCACCTA CTGCAGCAAT 5760 

AATTCGTTCT GCAAGTTGTT GTTCTTTGGT CATTTAAATC CCTCCTAAGG TTGTCTATCT 5820 

CTGATTGCTC GTTTAAaATG TCACCATTGT TTAATAACCG TCTTGTTGCT TCTTCCTTAG 5880 

AAATGCCACA CATACCCATA ACTGTCGCAA CTTTCACATC ATGCTCAGAT ACCTGATATA 5940 

ACGCCATTGC TTCATCATAT GTGATAGCAC ATATTTCTTG AATAATACGC ACTGAACGGT 6000 
CGATCAGTTT TTGATTGGTT GCTTTAACAT CAATCATGAG GTTATCGTAA ACTTTTCCGA v 6060 

25 CACCAACCAT TGTGATGGTT GAAATCATAT TTAAAATTAA CTTTTGTGCt GTACCAGACT 6120 

TTAAACGTGT TGAACCAGTT AATACTTCTG GACCAACTTT AACTTCTACT GGATAcTGCG 6180 

CAATTTCACT TATAACTGCA TGTTCATTGC ATGAAATAGA TACTGTTGTA GCACCGATTG 6240 

TGTTAGCAAA TGTTAAACCG CCTATAACAT ATGGCGTTTT GCCACTCGCG GCAATTCCTA 6300 

TAACGACATC TTTTGATGTT AAATCTATAT TTTTCAAATC TTCTTCCGCT AATTTTTTGT 6360 

GATCTTCCGC ACCTTCTACA GCCATCGTCA TAGCATGTTG TCCACCAGCA ATAATACCTA 6420 

TAATTTCATG AGGGTCAGTA TTGAATGTAG GTACACACTC CGCTGCATCT AAGACACCCA 6480 

ACCTTCCACT TGTACCTGCA CCGATATAAA TCAATCGTCC ACCCTTTTTA TACTGTGCAA 6540 

TTGTTTTTTT AATTACTTTT GTCAATTGTG GTATTGCCTT TCGAACTGCT AACGGGACTT 6600 

GCTGATCTTC TTTATTCATC GTAATTAAAG CCTCTTCCAC AGTCATTTCA TCAAGATGCA 6660 

TCGTCGCTTC ATTACGCGCT TCGGTCGTAC TATTTTCCAT CACTTCTTAC ACTCCCTAGT 6720 

TTTTTGAAAA TCAAATGTAT CATTCGGCTC GATACAACTT AACAGTGGTA AGTCTTCTTT 6780 

AATAATTTGT GCAaCAACAT TCACATTGTC ATGTGCACTA AGCGTTTGTC TCACAATTTG 6B40 

CATTTCGCCT TGATAACGTC CGTTATTCAA ATTATCAACG GTTACTGAAC CAATGCGTCG 6900 

TTGCGTCGTA AACTGTGGTT GAATCGAATG TGGACATATT TGTCTTGACG TTTCCGAACG 6960 

AATGACATTT TCCGGATTAT CCGGGCGTAC TTTATGACAC ATATCGAAAA GGTAAGTCAC 7020 
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AAGTTGTTTT GCCTG CCTCA TTTCAATCAA TGAGTCTCCA ACTAACACTT CAGATACACC 7140 

AGTTTCTTGT AATAATTTAG CTGCAACGAC AGGATGACTA TGTCTCGTTG CTTCAATTGT 7200 

TGGCAAGCCT TTATGCAAAG GACCTCGCAA ATCACTCCCT ACAATAAAAC CATATATTTG 7260 

TGCCTTTGGA TTAAATTGAT AAATGAGTTC ATTTTTCTTA TTGACCAAGT CAACAGATAA 7320 

TCCCGTATCT GGTCTTGGAT AATAGTTATG ACAAAATGAA AGTAATGTAA AATCATTCAA 7380 

TTGTTGATGT AAGCTTGTTA ACAATTCCCG GGAAATAATA CTTGCATTCA AACAGCACTT 7440 

TAAACCCTGT GCCATTATCG CTTCGATTGC CTCAATTGAT GTACTATGAT CGATACGAAT 7500 

CATAAATTGT GCATCATATT GTCGAAGATG GTCATAAAAA GATGGTGTTA AAATAGATGG 7560 

ATTAGCATCT ATGAGGTAAG TCACTTGTTC ATGTTTTAAT AAATTGAGTA GTTTTGTGAA 7620 

ATAATGATAT TTTGTCTCGT CATCTTCTTC TGGTATTTGT ACAGATGTAA AAATCATTTG 7680 

20 GTAACCTTGT TTAATCATTC GCTTAATATA CGCTTCATCT AAAGGTTGTC CTAAATACAC 7740 

TGAAAAGCCT GTCAAAGTAG CCCTCCTTAA CAATATAATT ATTAGGAAAA TATAGTTGAT 7800 

TTGTGTAATC GCTTACATTT TACTATAAGA GAAAACACAT TACAATATTA ATCAGTTAAA 7860 

GCCTGTTCAT TGTAATAATC TTACATATTT CTGTCACAAG TTAATTATTA CACCATCAAA 7920 

GATTATCCTT TCTTTTAAGT GCTGATAATA GCTGCTACTG CTGGATTATT ACAATAACTT 7980 

TTATACATTT TATTCAGGAT TATCTTATAT TATGTTTTAA TAATAATCTG TGAACAATTA 8040 

AGAGATTTGA AATTGAATTT AATAATTGTA TTGAAAACGC ATACTTCACC ATGCTAAAAT 8100 

AGGAGTCGCA AACAAATAAG ATTCAATAAG ATGTGATGGT TACCAACACA GTCTATTTGC 8160 

TCGTGTCTTT TTTTATTGAA TCTTAAATAA TAAATACAAC TTTGGAGGTT GGACAAGTGA 8220 

GGAAGAAACT TTTCGGTCAA TTGCAACGTA TTGGTAAAGC GCTAATGTTA CCTGTTGCGA 8280 

TTTTACCAGC AGCTGGTCTG TTATTAGCTA TCGGTACAGC TATGCAAGGT GAATCATTAC 8340 

40 AACACTACTT GCCGTTTATA CAAAATGGTG GCGTACAAAC TGTCGCTAAA TTAATGACAG 84 00 

GTGCTGGTGG TATCATTTTT GATAACTTGC CTATGATTTT CGCATTAGGT GTCGCAATCG 84 60 

GATTAGCTGG CGGTGATGGC GTAgcAGCTA TCGCAGCATT CGTCGGTTAC ATAATCATGA 8520 

ACAAAACAAT GGGCGACTTT TTACAAGTTA CACCTAAGAA TATTGGTGAT CCAGCGAGTG 8580 

GTTACGCTAG CATTTTAGGT ATCCCAACAT TACAAACAGG TGTGTTCGGC GGTATTATAA 8640 

TCGGGGCCCT. GGCAGCTTGG TGTTATAACA AGTTCTATAA CATTAACTTA CCATCTTATT 8700 

TAGGTTTCTT CGCTGGTAAG CGTTTCGTAC CTATTATGAT GGCTACAACA TCATTTATTT 8760 

TAGCATTCCC AATGGCATTA ATTTGGCCAA CGATTCAATC AGGATTAAAT GCATTCAGTA 8820 
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TATTAATTCC ATTCGGTCTA CATCACATTT TCCACGCACC GTTCTGGTTC GAGTTTGGTT 8940 

CATGGAAAAA TGCAGCTGGT GAAATTATTC ACGGTGACCA ACGTATCTTT ATCGAACAAA 9000 

TTCGTGAAGG CGCACATTTG ACAGCTGGTA AATTCATGCA AGGTGAATTC CCTGTTATGA 9060 

TGTTCGGTTT ACCTGCAGCA GCTTTAGCAA TTTATCACAC AGCTAAACCT GAAAATAAGA 9120 

AAGTAGTAGC AGGTTTAATG GGTTCTGCTG CTTTAACATC ATTCTTAACT GGTATTACAG 9180 

AACCATTAGA ATTCTCATTC TTATTTGTAG CACCATTATT ATTCTTTATT CACGCaGTAC 9240 

TTGATGGTTT ATCATTCTTA ACATTGTACT TATTAGATCT TCATCTAGGT TATACATTCT 9300 

CAGGTGGTTT CATCGACTAC TTCTTACTCG GTATACTACC TAATAAGACA CAATGGTGGT 9360 

TAGTCATTCC TGTAGGTCTT GTATACGCAG TTATTTACTA CTTCGTATTC CGATTCTTAA 9420 

TTGTAAAATT AAAATACAAA ACACCAGGTC GTGAAGATAA ACAATCACAA GCGGCTACTG 9480 

CTTCAGCAAC TGAATTACCA TATGCAGTAT TAGAAGCTAT GGGTGGCAAA GCAAACATTA 9540 

AACATTTAGA CGCTTGTATC ACACGTCTAC GTGTTGAAGT TAACGACAAA TCTAAAGTTG 9600 

ATGTTCCTGG TTTGAAAGAT TTAGGCGCAT CTGGTGTATT AGAAGTCGGC AATAATATGC 9660 

AAGCAATTTT TGGTCCTAAA TCTGACCAAA TCAAACATGA AATGCAACAG ATTATGAATG 9720 

GTCAAGTAGT AGAAAATCCT ACTACTATGG AAGACGATAA AGACGAAACT GTTGTTGTTG 9780 

CAGAAGATAA ATCTGCAACA AGCGAATTGA GCCATATCGT GCATGCACCA TTAACTGGTG 9840 

AAGTAACACC ATTATCAGAA GTGCCTGATC AAGTGTTCAG CGAAAAAATG ATGGGTGACG 9900 

GTATCGCTAT CAAACCTTCA CAAGGTGAAG TTCGTGCACC ATTCAACGGT AAAGTACAAA 9960 

TGATTTTCCC AACAAAACAT GCAATTGGTC TTGTATCAGA TAGTGGTTTA GAACTATTAA 10020 

TCCACATCGG TTTAGACACT GTTAAATTAA ACGGAGAAGG CTTTACTTTA CATGTTGAGG 10080 

AAGGTCAAGA AGTTAAACAA GGTGATTTAT TAATCAACTT TGATTTAGAC TACATCCGCA 10140 

ATCATGCAAA GAGTGATATT ACGCCTATTA TCGTGACACA AGGAAACATT ACAAACCTTG 10200 

ATTTTAAACA AGGTGAACAT GGCAACATTT CATTTGGCGA TCAATTATTT GAAGCTAAAT 10260 

AATGCTTACT ATAAACAGGT GCGTATACCT TCATAAGGTG ACGCGCCTGT TTTTTCTTTG 10320 

CTATTGTATT TTGCAGCATC ATTGATAGTT CGCTCTCCCC TTAAATTTTG AATTTTAAGA 10380 

TCATCAATTA AAGCCCCCCT TCATACTCAT TTCCTAAAAA ATATTAATTG TTCACTATTG 10440 

TTAGCGTTTT CACAACAAAG TCAACTTCCT TGACCTTACA CTATATTCGA GGCTATCATT 10500 

TTAAGTGTAA ATATAGAGAA AAGGTGGCTT TTTTTATGAA ACAACGCATT GGAGCTTACT 10560 

TAATTGACGC TATTCATCGA GCAGGCGTCG ATAAAATTTT TGGTGTTCCT GGTGATTTTA 10620 
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10 



15 



20 



25 



30 



35 



40 



45 



50 



ATGAATTAAA 


CGCAAGTTAC 


GCAGCGGACG 


GTTATGCCCG 


TCTTAATGGA 


CTCGCTGCAT 


10740 


TAGTTACTAC 


ATTTGGTGTT 


GGCGAATTAA 


GTGCCGTCAA 


CGGTATCGCA 


GGTTCATATG 


10800 


CTGAACGCAT 


ACCTGTCATT 


GCGATTACAG 


GTGCGCCGAC 


ACGTGCTGTT 


GAACAAGGCG 


10860 


GTAAATATGT 


ACATCACTCA 


CTTGGTGAAG 


GTACATTTGA 


CGACTATCGA 


AAAATGTTTG . 


10920 


CACATATAAC 


CGTTGCACAA 


GGTTATATCA 


CACCTGAAAA 


TGCAACAACC 


GAAATACCAC 


10980 


GTTTAATTAA 


TACAGCAATC 


GCCGAAAGAC 


GCCCAGTTCA 


TTTACATTTA 


CCAATCGATG 


11040 


TCGCAATCTC 


TGAAATTGAG 


ATACCGACAC 


CATTTGAAGT 


GACGGCAACT 


AAATATACGG 


11100 


ATGCATCAAC 


ATATATAGAG 


TTATTAGCAA 


CTAAACTGCA 


TCAAGCGAAG 


CAGCCTATCA 


11160 


TCATTACTGG 


ACATGAAATT 


AACAGTTTTC 


ACCTCCATCA 


AGAATTAGAA 


GATTTTGTAA 


11220 


ATCAAACACA 


GATACCAGTA 


GCACAACTTT 


CATTAGGAAA 


AGGTGCTTTT 


AATGAGGAAA 


11280 


ATCCATATTA 


TATGGGTATT 


TACGATGGGA 


AAATTGCCGA 


AGATAAAATA 


CGAGATTATG 


11340 


TGGACAACAG 


CGATTTAATT 


TTAAATATTG 


GAGCCAAATT 


AACAGATTCA 


GCAACAGCAG 


11400 


GTTTTTCATA 


CCAATTCAAT 


ATCGATGATG 


TCGTTATGTT 


AAATCATCAC 


AATATCAAAA 


11460 


TTGACGATGT 


TACAAATGAT 


GAAATATCTC 


TACCATCATT 


GTTAAAACAG 


TTATCCAATA 


11520 


TTTCATATAC 


GAATAACGCA ACGTTCCCTG 


CGTATCATCG 


TCCAACATCA 


CCCGATTATA 


11580 


CTGTTGGCAC 


AGAACCATTA 


ACACAACAAA 


CTTATTTTAA 


AATGATGCAA 


AATTTCTTAA 


11640 


AACCAAATGA 


TGTCATCATT 


GCTGATCAAG 


GTACATCATT 


CTTTGGTGCT 


TATGATTTAG 


11700 


CATTATACAA 


AAACAATACT 


TTTATAGGGC 


AACCGTTATG 


GGGTTCTATC 


GGCTATACAT 


11760 


TACCTGCAAC 


ATTAGGTTCA 


CAATTAGCAG 


ACAAAGATCG 


TCGTAACTTA 


TTATTAATTG 


11820 


GTGATGGCTC 


ATTGCAACTA 


ACTGTTCAAG 


CTATTTCAAC 


TATGATTAGA 


CAGCATATTA 


11880 


AACCGGTATT 


ATTTGTGATT 


AATAATGACG 


GCTATACGGT 


AGAACGACTT 


ATTCACGGCA 


11940 


TGTATGAACC 


TTATAATGAA ATTCACATGT 


GGGATTATAA 


AGCTTTACCA 


GCTGTATTTG 


12000 


GTGGTAAAAA 


TGTTGAAATT 


CATGACGTTG 


AATCATCAAA 


AGATTTACAA 


GACACGTTTA 


12060 


ATGCAATTAA 


TGGTCATCCC 


GATGTGATGC 


ATTTTGTCGA 


AGTCAAAATG 


GCTGTCGAAG 


12120 


aCGCACCGAA GAAACTCATC GATAtCGCTA AAGCTTTTTC ACAACAAAAT AAATAATTTC 


121B0 


ATCGTATACA 


GGGTATAAGT 


TTAAGCGAAT 


ACTTTATTAA 


ACGAATAGGA 


CTCTGATATA 


12240 


AGATGATTAA 


TTTTAATAAA 


ACCGCTTTAG 


TGTTAATCGA 


CCTGCAAGAA 


GGTATTCTTA 


12300 


AAATGGATTA 


TGCCCCATAT 


ACAGCTGAAA 


ATGTCGTTCA 


AAACGCTAAT 


AAATTAATAG 


12360 


ATGTTTTTAG AAAAAACAAT GGCTTTATCG 


CTTTTGTTCG 


CGTGAATTTC 


TATGATGGTA 


12420 
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AGTCGTTTCC 


ATCATTTATT 


AGACAAGAGA 


GATGACGATT 


TTGTCATAGA 


CAAACGACAT 


12540 




TTTAGTGCAT 


TTGTAGGAAC 


AGATTTGGAC 


TTACAATTGC 


GACGTCGAGG 


AATTGATACG 


12600 


5 


ATTGTTCTTG 


GTGGTGTCGC 


AACGCATATT 


GGCGTAGATA 


CGACAGCGCG 


AGATGCCTAT 


12660 




CAATTAAACT 


ACAATCAGTT 


TTTTGTTACA 


GATATGATGA 


GTGCACAAAA 


CGAAACGCTA 


12720 




CATCAATTTC 


CAATAGATAA TGTATTCCCA 


TTGATGGGAC 


AAACAATAAC 


TACAAACGAC 


12780 


10 


TTTCTAAATA 


Inl iuiiACXA 


A A f A T A T A 


TCCCCCCTTC 


GATCATGTTG 


AGGGGGATCT 


12840 




TTATTTCACA 


HJ\\j XAA.X 




GTCTAACCTT 


CTATATTTAA 


CATATTCTAT 


12900 


15 


ATCTGTTAAA 


TCGTTCTTAA 


CTTACGCCC C 


TACTACATAA 


AAAACAGTAT 


TTATTCCGGA 


12960 


ATTTTCAAAA 


AATTTAGTAT 


TTATTGCAAA 


ATTATGTATC 


ACTTTATGTT 


TAATTTTTGA 


13020 




TATTATCTTA 


ATTAAGTAGA 


TTTTTATAAG 


TTCTAAAAAG 


GAGAACAAAT 


ACATATATGA 


13060 


20 


AGAAGAAACT 


AAlAH I AAA 


GAAAACATGT 


TTATAGGTTC 


TATGTTATTT 


GGTTTATTCT 


13140 




TTGGTGCCGG 


LAATCTTATC 


TT CCCAATAC 


ACTTGGGTCA 


AGCTGCTGGT 


TCTAACGTTT 


13200 




TTATCGCTAA 


t- 1 i/yjftjAX 1 1 


TTAATTACAG 


CAATTGGCTT 


ACCATTTCTA 


GGTATCATTG 


13260 


25 


CTATTGGCAT 




TCTGGTTTAT 


TTGAAATTGC 


ATCGCGTGTT 


AATAAAACAT 


13320 




ATGCTTACAT 


1 X livAvonl X 


IjvwI XAXiiXL. 


TAGTTATCGG 


ACCATTTTTC 


GCCTTACCTA 


13380 




GACTGGCAAC 


^ 7A ^ A^ ^ A TTT 


A A ATTYSHA T 
Vj/v\rvX XvyV_nl 


TTTCGCCATT 


TTTATCACCA 


AAGCAAATCA 


13440 


30 


CTTTATATTT 


ATTTATTTTT 


/AO V_ X X \»VJ 1 


TCTTTGTGAT 


TGCATGGTTT 


TTTGCGAGAA 


13500 




AGCCATCAAG 


AATTTTAGAA 


TATATCGGTA 


AATTTTTAAA 


TCCGGTATTC 


TTAGTATTAT 


13560 


35 


TAGCAATTAT 


TTTATTATTT 


VJ <m X X X X X »»— ' \m> 


ATCCATTAGG 


TGGCATATCT 


GATGCACCTA 


13620 


TTAGTAAACA 


ATATCAATCA 


CATGCCTTAT 


TTAACGGCTT 


TTTAGATGGA 


TACAATACCT 


13680 




TAGATGCGCT 


AGCGTCATTG 


GCATTTGGTA 


TTATCATTGT 


TGCAACGATT 


AAAAAGTTAG 


13740 


40 


GTATCGAAAA 


TCCAACTGAT 


ATCGCTAAAG 


AAACAATTAA 


GTCTGGTACT 


ATCAGTATCA 


13800 




TTATGATGGG 


GATCATTTAT 


ACCCTACTAG 


CAATCATGGG 


TACATTAAGT 


ATTGGTCATT 


13860 




TCAAACTTAG 


TGAAAATGGT 


GGTATTGCCT 


TAGCGCAAAT 


TACTCAATAC 


TACTTAGGTA 


13920 


45 


ACTACGGTAT 


CGTCCTGTTG 


TCACTTATCG 


TTATGGTTGC 


TTGTTTAAAA 


ACAGCCATCG 


13980 




GTTTGATTAC 


GGCATTTTCA 


GAAACATTCG 


AACACCTTTT 


CCCTAAAATG 


AATTACCTAG 


14040 




CGATTGCAAC 


AGTTGTAAGC 


TTTATTTCGT 


TCTTATTCGC 


GAATGTTGGT 


TTAACTAAGA 


14100 


50 


TTATTATGTA 


CTCAGTCCCA 


GTGTTAATGT 


TCTTATATCC 


ATTAGCAATT 


GCCTTGATTG 


14160 




TACTAACATT 


ATTTAGTAGG 


AAATTCCATC 


ATTCAAAACT 


TATTTATCAA 


TGTACCATTT 


14220 
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GCACATCATT 


CTCACAAACT 


TTGATTAATT 


TCAGCCAAAA 


ATATTTACCA 


TTATCAGACA 


14340 




TTQGTATGGG 


CTGGGTTGTT CTCAGTTTGA TTGGTTTCAT 


TATCGGCTTC 


ATTATTTATA 


14400 


5 


AAATTAAGCA 


TCGTAAAATT 


CCACAAGCAT 


AATACTATGC 


CACAGTCATA 


TGTTAAACAT 


14460 




ATGCTTGTGG 


CATTTTTTAT TCATACTACA TTAAACTGCA ATCGTATACA 


TACATATCAA 


14520 


10 


TGATTATCCA 


CAAAAAATAT 


TAGTACTTTC 


ATTTTACAAA 


TCACATTAAT 


ACAAACACAA 


14580 


CCTTATCTTT ATATTATTAA ATTTATATTT GACACTTATA TTGAACAACT 


GTAATATATT 


14640 




AATATTAATT 


CTTTAAAATG TATAAATATA AAGGAGGGAG ACCGATGaAT 


TCAATCATTG 


14700 


15 


aATTAACTGA 


TTATTATAGC 


TCTAATAATT 


ATGCACCACT 


TAAGCTTGTC 


ATTTCTAAAG 


14760 




GTAAAGGTGT 


CAAAGTTTGG 


GATACTGATG 


GCAAACAATA 


TATAGATTGC 


ATTTCGGGTT 


14820 




TTTCAGTTGC 


AAACCAAGGC 


CATTGTCATC 


CAACAATTGT 


TAAAGCGATG 


ACAGAACAAG 


14880 


20 


CTTCAAAGTT 


GTCTATCATT 


TCACGTGTCC 


TTTATAGTGA 


CAATCTCGGG 


AAATGGGAAG 


14940 




AAAAAATTTG 


TCATCTTGCT 


AAGAAAGACA 


AAGTACTCCC 


CCTTAACTCT 


GGTACTGAAG 


15000 




CTGTTGAAGC 


AGCCATTAAA ATTGCTAGAA AATGGGGCTC 


TGAAGTTAAA 


GGCATTACTG 


15060 


25 


ACGGACAAGT 


TGAAATCATC 


GCTATGAATA 


ACAATTTTCA 


CGGTCGTACA 


CTTGGCTCAT 


15120 




TATCACTATC 


TAACCACGAC 


GCATATAAAG 


CAGGATTTCA 


CCCCCTACTT 


CAAGGCACTA 


15180 




CAACAGTAGA 


TTTTGGAGAC 


ATTGAACAAT 


TAACACAAGC 


TATTTCACCG 


AATACAGCAG 


15240 


30 


CAATTATTTT 


GGAACCAATT 


CAAGGTGAAG 


GTGGCGTTAA 


TATACCACCG 


AAAGGATATA 


15300 




TTCAAGCTGT 


GCGTCAACTA 


TGTGATAAAC 


ATCAAATATT 


ATTGATTGCA 


GATGAAATTC 


15360 


35 


AAGTTGGTCT 


TGGTAGAACT 


GGGAAATGGT 


TTGCTATGGa 


ATGGGAGCAA 


GTCGTTCCAG 


15420 


ACATTTATAT 


TTTAGGTAAG 


GCATTGGGTG 


GCGGCTTATA 


CCCTGTATCT 


GCTGTACTTG 


15480 




CAAATAATGA 


TGTCATGCGT 


GTTCTAACAC 


CAGGTACACA 


TGGTTCAACA 


TTTGGTGGTA 


15540 


40 


ACCCTTTAGC 


CATTGCAATA 


TCGACGGCAG 


CGCTTGATGT 


ACTTAAAGAT 


GAACAACTGG 


15600 




TTGAACGATC 


AGAACGCTTA 


GGTTCATTTT 


TATTAAAAGC 


GTTGCTACAA 


CTTAAACATC 


15660 




CTAGTATTAA AGAAATTAGA GGTCGTGGTT 


TATTTATAGG 


CATAGAGCTT 


AACACAGATG 


15720 


45 


CTGCACCTTT 


TGTGGATCAA 


CTGATTCAAC 


GTGGAATCTT 


ATGCAAAGAC 


ACGCATCGTA 


15780 




CTATCATTCG 


ATTGTCTCCA 


CCTCTAGTCA 


TTGATAAAGA 


GGAAATCCAT 


CAAATTGTTG 


15840 




CAGCTTTTCA AGACGTTTTT 


AAAAATTAAC 


AATTAATCAT 


TTATATATGA 


CATAGGAGGG 


15900 


50 


ATTCATGATG ATTAAAGTAG GTATCGTTGG CGGTAgcGGT TATGGCGCAA 


TTGAATTAAT 


15960 




TCGATTGTTA 


CAAACACATC 


CTCATGTAAC 


GATTGCACAC 


ATCTACTCAC 


ATTCAAAAGT 


16020 
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ACTTACAGTG GaTAATAATG ACTGTGATGT AATTTTCTTT GCGACACCAG CACCCGTAAG 16140 

TAAAACATGT ATCCCTCCCT TAGTAGAAAA AGGTATTCAT GTTATCGATT TATCTGGCGC 16200 

ATTTAGAATT AAGAATCGTG AAATATATGA AGCATATTAC AAAGAAACTG CTGCAGCACA 16260 

AGATGATTTG AATCATGCTA TTTACAGCAT TTCAGAATGG CAATCGTTTG ATAACAATGG 16320 

AACGAAGCTC ATTTCTAATC CTGGCTGTTT CCCTACAGCA ACATTATTAG CATTACATCC 16380 

10 

ACTTATTAGC GAAAAAATAG TAGATTTGTC ATCTATTATT ATTGATGCTA AGACCGGCGT 16440 

GTCAGGTGCT GGTCGTTCAT TATCACAACG gTTcATTTTT CAGAAATGAA TGAAAATCTA 165O0 

1S AGCGCTTATG CAATCGGAAA CCATAAACAC AAACCGGAAA TCGAGCAATA TTTATCTATC 16560 

ATTGCGGGTC AAGATGTATC AGTCATATTT ACACCACATC TCGTACCAAT GACACGAGGT 16620 

ATTTTATCAA CAATATATGT CAAATTATCA TCTGAATATA CGACTGAATC ATTACATAAA 16680 

20 TTAATGACCT CTTATTATGC TAATCAGCCA TTTGTCAGAA TTAGAGATAT TGGGACTTTT 16740 

CCAACCACAA AAGAAGTACT CGGTAGTAAC TACTGCGATA TCGGCATCTA TGTAGATGAA 16800 

ACAACGCAAA CAGCAATTTT AGTATCAGTG ATTGATAACC TTGTCAAAGG CGCAAGTGGG 16860 

25 CAAGCCATTC AAAATTTAAA TATATTATAT GATTTTGAAG TGACGACTGG CCTAAATCAA 16920 

TCACCAGTTT ATCCATAAGG GGTGTTAGAA TGAAACATCA AGAAACGACA TCACAACAAT 16980 

ATAACTTTTC AATTATTAAA CATGGCGATA TCAGTACACC TCAAGGCTTC ACGGCTGGTG 17040 

30 

GTATGCACAT CGGTTTACGC GCTAACAAAA AAGACTTTGG GTGGATTTAC TCATCGTCTT 17100 

TGGCAAGTGC AGCTGCCGTA TATACTTTAA ATCAGTTTAA AGCTGCACCA CTTATTGTCA 17160 

CTGAAGACAC TTTACAAAAG TCTAAAGGAA AATTACAAGC ACTTGTTGTT AATTCAGCTA 17220 

35 

ATGCAAATTC TTGTACCGGT CAACAAGGCA TAGATGATGC ACGACAAACA CAAACATGGG 17280 

TTGCTCAACA ACTTCAAATA CCATCTGAGC ATGTTGCTGT TGCTTCAACT GGGGT CATTG 17340 

4Q GTGAATATTT GCCTATGGAT AAAATTAAGA CTGGGACCGA ACATATTAAG GATGCTAATT 17400 

TTGCAACGCC AGGTGCGTTT AACGAGGCAA TTTTAACAAC TGATACCTGT ACAAAACATA 17460 

TCGCTGTATC ACTAAAAATC GATGGTAAAA CCGTTACAAT TGGTGGTAGC ACCAAAGGTT 17520 

45 CAGGTATGAT TCACCCAAAT ATGGCTACCA TGCTTGCTTT TATAACAACC GATGCATCGA 17580 

TTGAATCGAA TACACTTCAT CAATTATTAA AATCTTCGAC TGACCATACA TTTAATATGA 17640 

TTACTGTTGA TGGCGATACA AGTACAAATG ACATGGTATT AGTCATGGCA AATCACCAAG 17700 

50 TTGAACACCA AATACTTAGT CAAGACCATC CACAATGGGA AACATTTGTT GATGCATTCA 17760 

ATTTTGTCTG TACATTTTTA GCTAAAGCTA TAGCCAGAGA TGGCGAAGGC GCAACAAAGT 17820 
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CTATCGTAAG TTCAAATCTA GTAAAATCAG CTATTTTTGG CGAAGATGCC AATTTTGGTC 17940 

GAATCATTAC AGCTATTGGC TACAGCGGAT GTGAAATTGA TCCTAACTGC ACATATGTTC 18000 

AACTGAACCA AATACCTGTC GTTGATAAAG GTATGGCTGT ACTATTTGAT GAGCAAGCTA 18060 

TGTCGAATAC ATTAACTCAT GAAAATGTCA CAATTGACGT TCAGCTTGGT TTAGGTAACG 18120 

CTGCAGCGAC TGCATACGGT TGTGATTTAT CCTATGATTA TGTGCGTATC AACGCATCAT 18180 

ATCGAACATA AGGTGGTGTT GGTTAGATGA AATTTATTGT CATTAAAATT GGTGGCAGTA 18240 

CACTTAGTGA CATGCATCCA TCAATTATTA ACAACATTAA GCATTTACGA TCAAACAACA 18300 

TCTACCCCAT TATCGTTCAT GGCGGTGGCG CATTTATTAA TGAAGCATTA TCAAACCAGC 18360 

AAATCGAGCC ACACTTTGTT AATGGCCTAA GAGTGACTGA TAAAGCAACC ATGACCATTA 18420 

CTAAACACAC GCTCATTGCA GACGTTAACA CTGCATTAGT AGCTCAATTT AACCAGCACC 184 80 

AATGTTCTGC AATAGGCTTA TGTGGTTTGG ATGCACAGCT GTTTGAAATT ACATCTTTTG 18540 

ATCAACAATA TGGATATGTC GGTGTTCCGA CCGCTTTAAA TAAGGATGCT TTACAGTATT 18600 

TATGTACTAA ATTTGTACCT ATCATCAATT CGATTGGTTT CAATAACCAT GATGGAGAAT 18660 

TTTACAATAT TAATGCTGAC ACGCTTGCCT ATTTTATTGC ATCATCATTA AAAGCGCCTA 18720 

TTTATGTATT AAGTAATATT GCAGGTGTAC TCATCAATGA TGTTGTTATA CCTCAATTGC 18780 

CATTAGTCGA TATTCATCAA TATATTGAAC ATGGTGATAT TTATGGAGGT ATGATTCCCA 18840 

AAGTGCTAGA TGCCAAAAAT GCGATTGAAA ATGGCTGTCC TAAAGTTATC ATTGCATCAG 18900 

GAAACAAGCC AAATATCATT GAATCTATTT ACAATAATGA TTTTGTTGGC ACAACAATCC 18960 

TTAATTCATA ACTATGAAAT TAAGGCCTAA CAAGTTTTGA CACGCGAGAT GATTCCAGTT 19020 

CGATTATCCA TTGCGCTAAA ACATTTATTT ACCGTTCATC TCGTTAACAA TTTTGAATAC 19080 

AGTSCGATAC AATATGAGAT GTAAAAAACT AATAACCTTT TACAAATTTG TTTATCAAAA 1914 0 

TATTTTAAGT TTTGCAAAGC TTTTTATTGT GATTATTTTC ACAAAATACT ATAATGAGGA 19200 

TAGTAAATAG AGAGGAGTCC TTAAGTTGAC GAAACGACAA ATGGGTATAT TCATTTATGC 19260 

TGGAATTATC GGTGGCTTGT TATCTGGAAT TGTAAAATTA GGTTGGGAGG TCATGTTTCC 19320 

ACCTCGCACA CCAGAACGTA ATGCAACGAA CCCACCTCAA GAGTTATTGC AACAATTAGG 19380 

ATTTAGTAGT GAGTTTACGC ATCAAACATA TACATTTTCA AATATGGAAT TGCCTTGGGT 19440 

AAGCTTTATT GTCCACTTTA GTTTTTCTAT CGTCATTGCA ATTATTTACT GCATATTAGT 19500 

TAAAAAATAC GCTTACTTAG CAATGGGACA AGGTGCTGTT TTTGGTATTG CTATTTGGGT 19560 

ATTATTCCAC CTTATCATTA TGCCAATCAT GCATACTGTA CCTGCTGTGT GGGATCAACC 19620 
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AGTGCGACAA CATTTTGTCT ATCGCTATAA 
TGAGTTTtAA ATCATCGTTT GAGTATGATG 
5 ATGATATGAT TCCAGCCAAC TTACGTGAGC 
ATTATTTTCG GTAATTTCAA TATTGCTCAG 
TCGTCATGAT TTTGAATGAT GCCATCGTGT 

10 

ATCTAACAGT AAACATTTAG GCAGTATAGT 
CGTCATATTA ACTACTCAAT AACTGAAATA 
GTCCTAAGAA ACATACCTGT ACCATAAACT 

75 

CACGTGATTG ATAAAAGTGT GATTGTGTCA 
CTTCACCAAT CAATTTTGTA AAACTTTCTT 

20 AACTACATAT TTGATGTGCT TCGTTTGTAG 
AACGTTGTGA TATCTTTTCG ATATCAATAC 
TATAAGGATA ACTATATGAT AAGCTCACAT 

25 CAATATCTGC CTTACCTCGT GGCGAAATGT 
TGTCATGTTG AATTCCATAT TGCACTAAAA 

GATTGTATCT ATAGTTGACT GTACGCGGTT 

30 

ATTCTTCAAT ACTTTTCAAG TTACTCTGTA 

CTACTTACTT ATTGAATATT GTTTTGATAT 

TTATCGTTGG CCATTTTTCA CTGATGTGAT 

35 

TCATTGCTAG TTGTTGTTCA CGGTCAACAC 
GTTTCTGTAA AATTTCATTA AATGATTCAT 
CGCATTCTAA CAAAGATTTC ACCGGCATTT 

40 

GTGGTGTGTT GACCTGTGCT AATGCGACAA 
AATCTACAGG CATTTCAGCC ATGCTAACCC 

45 TTACCATTGA AAAACGGTTA GTCTTTATAT 
TCGTCAAATT ACCAACACGT ACAATCCGAC 
CTTTTAATTC ACTATAAAAT TTGCTCCGTG 

50 AGACATCCGC TTsTGAAAAT GTCACATCTT 
TTATCGTAGA CACATATATT AACCTTGCAT 

55 



ATTAAATTAA TACACTGACT AACATTAACG 19740 

ATTGATGCTC ACGTTATTTT ATTAACTGAC 19800 

ATTAAAGTCT CAAATGCGTC GTAACAAACT 19860 

TATATTTTTA CCTTATCACT TACTTTAATC 19920 

ATTCACCTTT CATTTTTCCA ATAAAAAAAC 19980 

TTAAAATCAC TGCGCAATGA TACTGTCAGA 20040 

CAGACACTTT TTTATAACCC CAGGGTGCCT 20100 

GATCAAAAAT AAATTGTTTG AACTTCACTT 20160 

TATCATAAAT GTCCAATCCT TTGATTAAAC 20220 

TTTGTGTCCA TATTTGATAA AAATCATTTA 20280 

AGAAACACGT CACTAACGTA CGCCAGTCTA 20340 

CAACTGGTTC TTTATCGACA ACACACACGA 20400 

AGATGGGCTG TCCATCACGA TTGTGTTGAA 20460 

GATAATGCCA TTCATGTGGT AATAAACCTG 20520 

TATCTCCCAA TCTGTGCATG AGTTTATCTT 20580 

TTTTATATGA CCAACGACTT TGTGATATTA 20640 

ATTGCATTAC AAATACTGTC ATAACTTTCC 20700 

ATTGTGCCCA ATGATACAGC CAATTGTTAG 20760 

TCATTATTTT TAATGTTAAT GTTGTATCTA 20820 

TAGTTAATCC AATCGTTTCG TACATGTCTT 2 08 80 

CGCTGACGAG TTCAATTTCT TTGCGCTTAA 20940 

TATTAGGTGA TAGCACATGG TAAATGATTT 21000 

TTTGTCTTGC AGTCGTATCC ACAAAAGAAA 21060 

CGATACAATC CAGTTGTAAC AAATCATTCA 21120 

TTCTCATATG CCATCTTCCA TTGTAAGGAT 21180 

CATCTAAGCC ATTATTTACA GCTTCTAATA 21240 

TATATGGTGA TGTTAGTAGT TGCCCTTTAT 21300 

CTGTGTCTAT ATCAAAATAA GTTCCCACAC 21360 

GATGTTGTTG TGCCAAACGT ATGACATCAA 21420 
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CACCTGCATG AATAATCGTA TCCATGTTTT CTGGTAAAAC AACATCATCC ATACACTCGA 21540 

AATCACCAAC AATGACTTCA ATGTTTGATA ACATTATTTC AACCGTCTCT TCTGAAAAAT 21600 

5 * 

AATCATTTAA ATTCGTCATC AACTTATACC ATGCTATTTC CTCATTATCA GCACGTATGA 21660 

AACAATAAAT GCGATGACTG TATCCTTGTA GTACTTCAAT CAGATAAGCA CCTAAAAAAC 21720 

CTGTCGCGCC AGTCAATAGT GTATTTCCTA GAGGTCGATG ACTTAGACTA TCCTCTAAAA 21780 

10 

TACCCAAGTT ATAACGAGAC ATAACAATCT TTTGTAATTC CGAAAGATTA TCCGGTAATG 21840 

CAACTAATGA TTGTTGATTT TGGTACATAT AATTAACAAT CTGTCGCACG GTTTTATATT 21900 

15 GGTATAATGT CTGCATTGAA ATATGATGGC CAAATCGTTT TAAATGCGAG ACAACTAACA 21960 

TCGCCTCTAA TGAGTTACCA CCAAGTTCAA AGAAATCATC GTCAACACCG ACATCATTTT 22020 

GTTTCAATAC CTCTCCAAAT ACATCAACAA ATGTCTGCTC AATTTCATTA GAGGGTTCGC 22080 

20 TATACACTTT ATTAGACTGT TGTATAGGTG ATGGATTTGG CAAACGCGTA GTATCCACCT 22140 

TGTCATTCGT GGTTAATGGC ATACAATCGA TATGCGTTAT AGTCTTAGGA ATCATATACT 22200 

TAGGCAGCTG ATCATTTAAA TATTGCTTCA AATCCTGTTC CACTTGTTGC TCTCCGACAT 22260 

25 AATAAGCATT CAATATATCA TGCGTATCAA AGTGACTTAC TGTTACAACA CAATCAGATA 22320 

TACCACGAAT AGCTAATATT GCATTTTCAA TTTCATCAAG TTCAATACGG TACCCGTTAA 22380 

CTTTCACTTG TTTATCTATT CTTCCTAAAA ATTCAATTTG ACCATCAGAT GTATAACGTG 22440 

30 

CTAAATCACC ACTATGATAC AACTTTCCTT TACCAAATGG ATTATTTTGC CATTTATCAG 22500 

CCATTAATTC TGGACGATTA ATATATCCTA TCGCTAAACT ATCACCTGCA ATACACAACT 22560 

CGCCTGGCAT ACCAATACCG CATAACAAAC CATCTGACAT AATATACACT TGGATGTTAG 22620 

35 

ATAAGGGTTT GCCAATTGGA ATCGTCTCAG GTATCAAATC ACCACAATGA TGTGACCAAT 22680 

ACGA?GTGAT GACTGTTGAC TCAGATGGTC CATAGGCATT GAAATACGTG CCACAATGCT 22740 

TCTCAATATA TTTAACAAAG GATGCCGTAC TAGTTGCCCC GCCTGTAATC AACTTTTCAA 22800 

40 

TATAAAAGTC TTCCATAACA CTACACATCT GTAACGGAAT CGACGCAACC GTCACACGAT 22860 

GCTTATTAAT GAGTTGTTGT AACTGTTCTG GATTAACACG TTCCTCTCTA TCTGGAATCA 22920 

45 CAAGCGTATG ACCATTTAAC AAACAACAAT AAATCTCCAT AACTGATGCA TCAAAAACAA 22980 

TATTTGCATG . TTGCAAAAAT ACTTCATTGT CGCCTAATTG CAATTCAGTT GACCATGCAT 23040 

GCACTAAATT CAACAAATTT CGTTGTCGTA TGGCAACCCC TTTAGGCATC CCGGTCGTAC 23100 

50 CAGATGTGTA AATAGCATAC ATCTCATTAT CTAACATCGC TGTGTTTTCA AGTTGATTGC 23160 

CATGTAAATC ATCATATTGT TCATTTTCCT TTGATTCAAC AAAGCCTTTA GCATTTTCCA 23220 
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TAGCATCCTC CAAAATTGCA CCTTGTCGTT TATTCGGAAA ATCAATATCG ATAGGTATAT 23340 

AAGATGCACC TACTTTAACT GTCGCCAACA TCGCCGCAAT CATTTCAAAA CTACGTTCTG 23400 

5 TAAACAAGGC AACCCGTTGA CCATTGCCCA CACCATTTGA TAGGAGCATG TGCGCAATGG 23460 

CATCCACATA GTTGCGTAAT GTTTCATACG TCATTGTCAA ATCATTCATG ACTAGCGCAA 23520 

CATGATTACC TTGTCGTGAG ACAACTTCAT TAAAGTAACT TATGATAGAT TTATTTCCCG 23580 

JO 

GGACATTAAG CATTCGATCG TTAACATGCG TATTGACCCA ATTTAGAAGT TCCTCCGTGC 23640 

CGTTTGGTAT ATCACAAATT TGTAGTGTAT CTTGATGCTT CAAAATATAA TCAATCATAA 23700 

TCATACATTG ATTACCCATG TGACGAACTG TTTCTGAGTG ATATAAATCG GTATTATACT 23760 

15 

CGATATTGAT TGTATAGTCA TCGCGATCTT CTTCAATGAT GAAAGATAAA TCAAATTTCG 23820 

CCGTCACTGA TTTGGGTTGA ATGTGTGTTA ATTTACTATG CCCAAAATGA GCATGATTCG 23880 

2Q TTTCATTGTT TTGTAGTACT AACATGACAT CAAATAATGG ATTCCGTGAG GCATCATGTG 23940 

ATTGATCTAA GTCATTTACT AAACATTCGA ATGGGTATTC TTGATGCTCG TATGCCTCCA 24000 

AACTCATTTC CTTAACCTCT TGTAAAAACT GTGTCCACAT TTTATCAGGT GACGGTTGCC 24060 

2S CTCTATATAC CAACGTATTA GCAAACATGC CTAGCATTTG CTCCGTGCCT TTATGCATAC 24120 

GCGCACTCAT CACACTACCG ACAACAACAT CATCTTTTCG AGCATATCTA CTTAACAACG 241 BO 

TCATGACCAC ACTCATAAAG AACATAAAAT CAGTAATTTG ATGCTTTTCT ACATACTTTT 24240 

30 GAAGTAGCTG TCTCATTTGT TGATTCATTG TAAATGACAT CATTGCTCCA TTTGTCGTTT 24300 
TAATATTTGG TCTAACATAG TCTGTCGGTA AGCTTAAAAT AGGTACTTCA TCTTTGAATT * 24 360 

GAGATAACCA ATATTGTCTA TGTTTCGTCA TATCACGATG CGACATCCAC TCACTATAGT 24420 

35 CTTTATATTG CAATTTAAGT GGTAACAATA ATTTATGTTG ATAAAGTGCG TTAAGATCAT 24480 

TCATTAATTG TATATTACTC ATACCGTCAT TAATGATATG ATGCGTATCT ATAAAGAGGT 24540 

ATGCATGTAA GGGACTTCTA ATGTATCTCA CTCTAATTTG ACTTGGCTTT TCCAAATTAA 24600 

40 

AAGGTGCTAC AAATTGGCGC ATGATTTCTT GTTCATCCGT AAAATGCGTG TTAACTTCTT 24660 

CAAAGTCAAC TGCAACATCT GCCACAATAC GTTGTCGAAC CTCATCATCT ACAACAATAT 24720 

ATTGTGTTCG TAAAATCTCA TGTCGCGCTA TCAAACGCTG CACTGCTTGT CGCAATTGAG 24780 

45 

CTACATTAAG TTCTGATGAT AACCGCCATA AAAAAGGTAC GTTATACACC GTATCTTTAT 24 840 

GGTTTGATTT CCATAATAAA TACATACGCT TTTGTGCAGA GCTCAGCACA TAATCATCTT 24 900 

so TAACTATAGT TTCTGGAATC ACTTCATAGT TTTGTTCTTG AACCTTAGCA ATCGCTTGTG 24960 

CTAGTTCAAA TACAGTTGGC TTTTGTAATA AATCACCAAT TTGTAATCGT TTCCCAGTAG 25020 
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AATTATCATG 
AGTGTTCGGT 
GCAATGCCTT 
AATTAACTGG 
GTGATAATGT 
GAACAATAAC 
ACAACTCAAT 
TGTTGCCATC 
TTGAATCTTT 
ACCCAAAGCC 
GCATGATATA 
TGTTAGGTAT 
TAATTTGAGG 
CTCCACCAAT 
GATTAAATAA 
CTACCGCTAT 
GCAATGCACC 
TCGTCGTCTC 
GGTGCGGAAT 
CATGATCTTC 
TCAA&TCAAT 
CAACTTTAGG 
CAATTGGCAC 
TACTTTTTTC 
AACGGTGTGC 
CAAATTGCAC 
CTGTTTGCGC 
CACGTTCTGT 
TAATTTGCAA 



AATACCTACT 
ATCTGTACTC 
CTTATCTAAT 
TATCATGTAC 
ATGCATCGCT 
AACTGCTTTA 
CCTAAACCCT 
GGGTAACAAA 
GATAAATTTA 
ACTTGTACAT 
AACATGAGTA 
ATTATACGTC 
ATGCTTCGGT 
TAATAAATAC 
TGAGGAGGTT 
TGGATTTAAT 
ATATATTTCA 
TTCATTTAAT 
TAGTGTCCCT 
TAACGTGTTA 
GTGATTAATA 
CGTTACATCT 
GTAAGCCCCA 
AGCTATGACA 
TAAATCATTC 
AGCGACATGA 
ATCATCTATC 
CATCAAATTA 
ATAAATATTT 



TGATTCACAT 
GGTGCTACAT 
TTCCCATTAA 
TCCGGTAAGG 
TCATAATAAG 
TTAATACCTT 
CGAATCTTAA 
CGAACGATAT 
TCTGCTGTCA 
AATTCTCCAG 
CCCAGAATCG 
GTTGTAAATG 
TTTTGATTAA 
TTTAACGGTA 
AACCACATAG 
AATTGTTCTT 
AATGTTGCAG 
GGTACATAAT 
TTAGGGTTAC 
CATTTAGAAA 
TTTTGTTTAC 
TTTAAAATGT 
CCAGCTTTCA 
GCGACACGAT 
GCGCGTGCAT 
TTCGGCGTTG 
TCAGGCAAAC 
AGTTCATCTA 
CGAACTAAGT 



GTAAAATATC 
AGGCATCCGT 
TAGTAATAGG 
TCATACGTAA 
CAACGATATA 
GTATACGCTC 
CTTGTTTGTC 
CACCACTTCT 
ATTCTGGCTG 
GAATACCAAC 
GTTTACCAAT 
TTGTATTTTC 
GCAAATCCAC 
CCAATACTTC 
TATTAACGTC 
TTTTAGCAAC 
CATCAAAGGC 
GATTTTGATG 
CAGTTGTCCC 
GATTATCAAT 
CATTTTCATA 
ACTCCTGACG 
ACACACCTAT 
CATTAGGTTC 
TCAATGTTTG 
CTTCAACTTG 
TTAAATTGAT 
CAGTTGTTCG 
CACTCAGCGT 



TGCAAAAATT 
ATCGACATAG 
AATTTGCTCA 
TTGTGATTTA 
CTGATCTTGA 
GAGCGCATGC 
CTTTCGATAT 
ATACATCAGC 
ATTTAAATAA 
GCCACACCGA 
AGGAATACGA 
AGTTGGTCCA 
CCACTTAGCA 
TATTCGTTCA 
ATTTTCATTG 
AATCAGCTTT 
TATAGTTCCT 
GACCAAGCGA 
CGACGTGTAA 
ATTTTTCCAC 
TAAAGCTTGG 
ATCACTTGGA 
CATCGCTATT 
AACACCATAC 
ATATGTTATA 
TTGCTCAAAT 
ATCGTCATAT 
TTTATTTCCA 
CTCGATTGAG 



TGGCATAGCA 
TCCATGATAG 
ATATGCATGA 
ATCTTATTAT 
TCATGATTTT 
TCAACCTCTG 
AAATAATCTA 
TGaTTTATAT 
CCTGCAGCTA 
CGCTCGCCTT 
TTTGGAACTT 
TAACCATTAA 
TTCAATACTT 
CTAGCAATCT 
ATTAATTGTT 
CCACCATTGA 
GATAACAAAA 
ACAATACCTC 
ATAACATAAG 
GCTATCTTAT 
TACGTTATTA 
TAGTTCGGAT 
ATCATCTCAA 
TGGTTTCTCA 
AACAcTCCGT 
AAGGTAACAA 
AATTGAATAT 
TTTTCTTCAG 
AGCAAATCAT 



25140 
25200 
25260 
25320 
25380 
25440 
25500 
25560 
25620 
25680 
25740 
25300 
25860 
25920 
25980 
26040 
26100 
26160 
26220 
26280 
26340 
26400 
26460 
26520 
26580 
26640 
26700 
26760 
26820 
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CTAAAGATGT ATGTGCATCA TGTATTTGAT GTACATCCTC AATAACATCA TTACAACAAG 26940 

ACATCATATG ATGATAACAA TGAAAAATAG TCTCTAGTGA AAGCGAAGAC TTCGCGCACT 27000 

GTAATTGCGA CATATTTTGC AACACACATT TATTAAAATC TGTTGTAAAA CGTTGACATA 27060 

CATCTTTTGC ATCGATTGTT AACGTTAACG GCACAATATT TCCGTGTAAA TCATTTGGTA 27120 

AATGTGATGG TACATGTATA CCTAATGTGA CATCATGTTG TTGACTCATT ATATGATTAG 27180 

CTAAATACAC ACTAACAGCC AACGATGCCA TATCTATTGA TGTCATATCA TCAATCAAAT 27240 

ACGTTTGATA TAAAGCTTGT TCAAATGGAT GCTTAATTGG AAAATAACTA TCAATATGGA 27300 

TGTCAGAGTT ATTCTCTAAC CGAAAATAGT TTGAGTCTAA TGCTATATGC GATGCATCTT 27360 

GATTGTCTTT ATCATCATTT CTATTTATAT GTGCATGCTG TCGAGTATTG TTAATAACAG 27420 

TATTGCCACG ATATGCATTG CATAAATCAT CAAGAAilAAT ATCAATTTGA CTATCATCga 27480 

AAATGGaCAC ATGAAAATCT aATAGTATAT ATGcAGCATC AGCGAACTGm AACAATTTAA 27540 

CTTTGAATAA AGGTGAATCA TTAAAATGGT AAGTACTTAA TTCTTGCTTA AAAAAAGCTT 27600 

CTAAATCATA GTTTGCGGAA GAAGATGGAA CTTGTTTTAT CTCAATAAAA GGCAGAAATT 27660 

CATGAAGTAT CATTGTTAAA TTGTCATCGG TAGTAACATC AAAAAAATGT CTTATAGATG 27720 

CATGTTGTgC ACAATTGTCG ATAATGCATA CATCATTTTA GTAGCTTCAA GATTTTTAGC 27780 

GAGTTTAACC CAATACGCAT TACGGTGTGT CGTTGATTCT GTATTATTTT TGTATATACG 27840 

AAAATATTCC TGTTGAAATC TCAAATTACC CATAATCATA AAAAGTCCTT CTTTCATATC 27900 

ATAATACTCA TTACTTACTG AAATTGCATG ATGATATGAT AACCGACGAA ATGTTAATTA 27960 

ACTCGTTATG TAATGaTTAA TATaAAACAC CATTCGCAAC ATATGAGCGA TATATTCTAC 28020 

CCTAAAATAC ATCTTGTATC ATCGTTACAA TTGGTATATT TTTCAATGTA AATTACATAC 26080 

ATCTTCGATA AATAGCACAC TACAAATCGT TAATCACTTT CTGTTGTTCA CATCTCATTG 2814 0 

CAAACTCAAT ATTGTTGTTA CAAAATATCC ATGAAGCAAG TTTATATTAA ACAAACAACT 28200 

CGCATAAAAC AATTGTTATC CTTAAATTTT AACAAATTCT TAATAAATTT ATCTCTATTT 28260 

TAATTACGAC CAAATTAATA GGTTTTCCAT ATAAAAAGAT GCATAAAATA AATATTTAAA 28320 

TAAATTCAAT TTGTATTCAC TTGTTTTTGT CCCCCAAATA CACCAGCAAC AAGCATGCTA 28380 

GCACCAATTG TTAAAACGAT AAACATATAC AGTCCCATTT GTAATGACGT TAAGAAAACA 28440 

CCCAACACAA TCCCTAACCT AGCTAGTGTT TCTGAAAAAT GAATACCTAA TGCATTAACT 28500 

GCACTATATG TTCCTCTTTT AGCTTTAGGA ATAATTTTAA AGCGTTGTTC TGAAACTATA 28560 

GGCGAATAAA TAATTTCACC TACAGTCGCA ATTATCATAA AAACAACTAA TAAGCCAAAC 28620 
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GCTTTTTTAA AATCTATTTT CAATACAACT TTCGAGATTG AATACGTGAG TAaAATGACG 28740 

ACGACCGTAT TAATCATTAG CAAGATTGCT AACATCTTAG CACCTGTAAT ATCATATGAA 2 8 BOO 

CCTATACTTA TTGTTTCAAA CTGATCCTTT AGTCTAATAG CAATATATGA GGAGATTGAA 2 8B60 

AATTCACCCA TCATGATGAT ACTGAACCCC GAAATCAATA ACATATAATT ACGGTCTTTC 28920 

AAAACTAATT TATAACTGCG AAATATATTC ATTATTTGTA ATTTTTGATA ACGACTTGCA 28980 

TGCCTCTTGT CATCACTTTG CTTTACTTGA TTTCGGTCTT GAGGTAACCA AATATATAAA 29040 

ATAAAGAGTA CAATTAAAAA TATACAAGCT GCTATTAAGA AAAGTAGTAA CATACTGTAG 29100 

CCATACATCA AGCCACCTAA CAATGCCCCA ATAGCTACCG ATAAGTTTGT CATCCAATAG 29160 

CTAATCTTGT AAATATAATG TTCCACGTCT TCGGTAATTG CATC CAT AAT TAATGTGTCC 29220 

ATAACTGGAA ATTGTAATCC CCAAACGATT GTAAATATGG CATATGCAAC ACAAAAACCA 29280 

ATAATTTGCC ACAATTGATG TGACCCAAAT ACGCCCATGA ACACAAGCAT TATCACCATC 29340 

GTCGCTTGAT AAATAAGTAC TAGCAACTTT tTCGGAAATA TCTCAATAAG GTAACCAGAT 29400 

ATAATGGACA ATGGAAATTT nAGAACCACT AAACCAACAA GATATATACC GACAATTGAT 29460 

TGACTTAACA TATCTGTTAA ATATAGTGCT ATAAACGGTA TAAATGCTGT CGTAATAATT 29520 

AGCTGTAAAA nATTGCTAAT CAATCGTACT TTCAA 29555 
(2) INFORMATION FOR SEQ ID NO: 207: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1539 base pairs 

(B) TYPE : nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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r (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 207: 

AAAAAAAAAA AAAAAnGGTG AATCTTTAAT TAAACACTAA TATTGTAAAA GATGTTAAGT 60 

AAACGCTTAA TGACACTTAT TTTTTGAAAA TAATAGTAAT ATCATTTTGT TAAATGAAAG 120 

AATAAAGCTA TAATmATTAT AGAATAACTA TTTAAAGGAG ATTATAAACA TGCCAATTAT 180 

TACAGATGTT TACGCTCGCG AAGTCTTAGA CTCTCGTGGT AACCCAACTG TTGAAGTAGA 240 

AGTATTAACT GAAAGTGGCG CATTTGGTCG TGCATTAGTA CCATCAGGTG CTTCAACTGG 300 

TGAACACGAA GCTGTTGAAT TACGTGATGG AGACAAATCA CGTTATTTAG GTAAAGGTGT 360 

TACTAAAGCA GTTGAAAACG TTAATGAAAT CATCGCACCA GAAATTATTG AAGGTGAATT 420 

TTCAGTATTA GATCAAGTAT CTATTGATAA AATGATGATC GCATTAGACG GTACTCCAAA 480 
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AGCTGACTTA TTAGGTCAAC CACTTTACAA ATATTTAGGT GGATTTAATG GTAAGCAGTT 
ACCAGTACCA ATGATGAACA TCGTTAATGG TGGTTCTCAC TCAGATGCTC CAATTGCATT 
CCAAGAATTC ATGATTTTAC CTGTAGGTGC TACAACGTTC AAAGAATCAT TACGTTGGGG 
TACTGAAATT TTCCACAACT TAAAATCAAT TTTAAGCAAA CGTGGTTTAG AAACTGCAGT 
AGGTGACGAA GGTGGTTTCG CTCCTAAATT TGAAGGTACT GAAGATGCTG TTGAAACAAT 
TATCCAAGCA ATCGAAGCAG CTGGTTACAA ACCAGGTGAA GAAGTATTCT TAGGATTTGA 
CTGTGCATCA TCAGAATTCT ATGAAAATGG TGTATATGAC TACAGTAAGT TCGAAGGCGA 
ACACGGTGCA AAACGTACAG CTGCAGAACA AGTTGACTAC TTAGAACAAT TAGTAGACAA 
ATATCCTATC ATTACAATTG AAGACGGTAT GGACGAAAAC GACTGGGATG GTTGGAAACA 
ACTTACAGAA CGTATCGGTG ACCGTGTACA ATTAGTAGGT GACGATTTAT TCGTAACAAA 
CACTGAAATT TTAGCAAAAG GTATTGAAAA CGGAATTGGT AACTCAATCT TAATTAAAGT 
TAACCAAATC GGTACATTAA CTGAAACATT TGATGCAATC GAAATGGCTC AAAAAGCTGG 
TTACACAGCA GTAGTTTCTC ACCGTTCAGg aAACAGAAGA TACAACAATT GCTGATATTG 
CTGTTGCTAC AAACGCTGGT CAAATTAAAA CTGGTTCATT ATCACGTACT GACCgTATTG 
CTAAATACAA TCAATTATTA CGTATCGAgA TGAATTATTT GAAACTGCTA AATATGACGG 
TATCAAATCA TTCTATAACT TAGATAAATA ATTTTCTnTA TAATCAAATG CTGACATAAT 
TTTAGTTGAG GATTATTATG ACGGTATAAA TAAATAAAG 
(2) INFORMATION FOR SEQ ID NO: 208: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: B46 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 208: 
CAATTTCTAT CTATCAATGA TGTGCATACT TCCAnTTAAA TTAAtCGAAA TGaATCAAGG 
TATATCATTC CTGCCTCTTT ATATAACaAC AAATAGTGAT TACAATATTT CGGTTATTAA 
CACGAAAATT TTACAAGCAC CTATTTCATT TACATATATA TACAGCAAAA AAGAAAGCCC 
AGAAATATTG GTGTTTATTA AATCATTTAA AAAGTATATT GCCAATGAAC AATTATAATA , 
AATTTCAAAT CTAAAAAACC AAGAATGCGA TTAATCATCA CATTCTTGGT TCAATTTTAT 
TCATGAATTT TTTCAACATT AAACGTTAAG TTATTGTCTG AATTTAAATT AACTTTAATC 
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CGTTGTACAA AACGTTTTAA TGGTCTTGCA CCGTATTGAG GTTCATAAGC TTCTTGACCT 4 80 

AGCCAAGCTT TAGCATCATC AGAAACTTCA ATTGAGATTC GTTGTTCTAA TAATCTTATA 540 

5 TTTAATTGCG TTAAGATTTT ATCTACAATC ATACTCATGT CATCAATAGA TAATGGTTTA 600 

AATAATACGA TATCATCCAT ACGATTCAAA ATTTCTGGTT TGAAATATGC ATTTAAACTT .660 

GTCATAACAG CTTTTTCTGT TGATTCTGTA ATTTCACCAG TCTCTTTTAC GTTTTCTAAT 720 

10 AAAACTTGAG ATCCAATATT ACTTGTCATA ATAATAATAG TATTTTTAAA ATCAACGCTA 780 

CGTCCTTTAG AATCAGTTAA ACGGCtTCAT CTAAAATTTG CAATAATACA TTAAAGACGT 640 

CAGTAT 846 



15 

(2) INFORMATION FOR SEQ ID NO: 209: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 1674 base pairs 

(B) TYPE: nucleic acid 
20 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

2S . (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 209: 

GTTGCCATAC ATGAGCGTCG ATTTTTCCAA 60 

TGGAGGAAAA GTAAATGATT AAACCTAAAA 120 

CAGGTGGTGC CGGCGTAATG GCTGATTTAA 180 

TGGGCGTCGT TACAAGTmTT GTTGCTCAAA 24 0 

TAAATCATCA ATGGGTAGAT GAACAACTTG 300 

CTATTAAAAC GGGGATGATT GCTACAGCAG 360 

TGCAACATGA ATCTATTCCA TATGTAATtG 420 

ATaATGGwTA ATGACaCAAg CaAAACTTGC 4 80 

TAACACCGAA TTTACCAGAA GCTGAAGAAA 540 

AAATTATGCA GGCTGGCCGC ATCTTTATTA 600 

AAGGCGGTCA TTCAAATGAT ACTGATATAG 660 

TTCAAACATT TGAAAATGAA CGATTTAAAA 720 

TTTCAGCAGT TATAACGGCA GAACTTGCAA 780 

AGGCTAAAAA GTTTATTTCA ATGAGTATAC 840 

GTCCAGTGAA TCATTTTGCA TATTTAAAGA 900 

55 



nTGGGAACAG TAAGCCAGTA TTTTTAGAAA 
TATGGCTATG ACACTAGAAC AATGGGAATT 

30 TAGCATTAAC CATTGCAGGT ACTGATcCaA 

AATCATTTCA TTCATGTGGT GTATATGGTA 
ATACATTGGG CGTAGAACAT ATTCATAATT 

35 ATAGTGTCTT CAATGATACC TTACCTCATG 

ATACTATGGA AACGATTCGT CATTATTTAA 
ATCCTGTTAT GTTGGCGAAA rCggTGATTC 

40 

AGCATaCGTT ATTGCCATTA GCTGACGTAG 
TAACGGGACT AACCATTGAT AGTGAAGAAA 
ATGAGATTGG TAGTAAAGGT GTCATCATTA 

45 

. CAAAAGATTA TTTATTTACT AACGAAGGTG 
CAAnACATAC GCATGGAACA GGGTGTACAT 
50 AAGGTAGACC ATTATTTGAG GCTGTACACA 

AATATACGCC TGAAATCGGC CGTGGTAGAG 
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TGTTATACAA ACGATGTAGT TAAAAATTTT ACAGCGAATG GTTTATTAAG TATTGGTGCT 1020 

AGCCCTGCAA TGAGTGAAGC TCCCGAAGAA GCTGAAGAAT TTTACAAAGT TGCACAAGCG 1080 

CTATTAATCA ATATCGGTAC TTTAACAGCA GAAAATGAAC AAGATATTAT TGCGATTGCT 114 0 

CAAACGGCAA ATGAGGCAGG CTTACCTATT GTATTTGACC CTGTAGCTGT TGGTGCTTCT 1200 

ACATATCGAA AGCAATTTTG TAAATTATTA TTGAAATCAG CGAAAGTATC AGTAATTAAA 1260 

GGCAATGCAT CTGAAATATT AGCGTTGATT GATGATACAG CAACTATGAA AGGTACAGAT 1320 

AGTGATGCTA ATCTTGATGC GGTTGCAATA GCGAAAAAGG tTACGCAACA TATAAAACTG 1380 

15 CAATAGTAAT CACAGGTAAA GAGGACGTTA TTGtTCmAGA TAATAAAGCC TTCGTATTAG 1440 

CTAATGGATC TCCATTATTA GCACGAGTAA CTGGAGCTGG TTGTTTATTA GGAGGCGTTA 1500 

TTGCTGGATT TTTATTTAGA GAAACAGAAC CAGACATAGA AGCGTTAATT GAAGCGGTAA 1560 

GCgkATTTAA TATTGCTGCT GAGGTAGCTG CTGAAAATGA AAATTGTGGT GGTCCTGGTA 1620 

CGTTTTCACC ATTGTTGCTT GATACGTTAT ATCATTTAAA TGAAACAACC TATC 1674 
(2) INFORMATION FOR SEQ ID NO: 210: 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2232 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 210: 

35 ATGAGTTGCC GATGAATTTA GCACCACCAA CGATTGCnTT TGATACTGTG TCCCAACCAG 60 

CTTGTTTAGC ATATTTAATA CCTTCACGTA AAGGATCGTT ATCATATGCA GCAATACCAA 120 

ATACGTTATG GTATTTCGTG TTTGAGTTAG TTACAACTTT GTnTTGCACT ACATCTGCAC 180 

CTTTCGCTAA TTGAGAAGTA CCGTTACCTG TTTCTAATAG GGCATGTGAG ATAAGATAAA 24 0 

CTTCATTAAT GCCATACATT TGAGCAGCTT TGTTAAATGC AGCACCTTGG TTTTCTAATA 300 

CACCTTTACC TTTTAAGAAT TGATTAATTT TATCAATAGA AATATTTTGT GGTTGGTCTA 360 

AGCGTAAGAA TTGATATTTT AATGCTGGAT CTTGAGCTAA ACGCTTCGTA TCCATTGCAT 420 

GCTTAACATC ATTAAATTTA GCATCTGTCC ACTTACCTGG TACACGTTGT ACTTGTGGTT 480 

TATATTGTAA ACCAGCTTGT ATTTGAGCAA CTTGGTTTAA TGTCATACCT GTTTGATTAT 54 0 

ACTTAATTAA TTCTTTAGCT AAATCAGTTG ATTTAATCCA TGCtAATTTA CCGTTAGATA 600 

ATTTACCATA GTACCAAGTT TGTCCATTAA TGACTTGTTC TTTAACAACT GCGAATGGTT 660 
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AACCATTACC ATTTTTAATT ACATAAGTGT AGTTATAATC TTTGGcAGCT GATGTAGTTG 780 

GTTTCACAGC AGTTGGTGCA GTTAAATCTT TTGCATTTAC CCAACCAGTG CGGTTATTAA 84 0 

TAGTACCGTA TAAATAAACA TCTTTGCCTA CAGATACTTG TTTCGTTGCA TTAAATGTAC 900 

CTTGAGCAAT GTTATTGCCT GTTAAAATGA CTTGGTTTTT AGTACCCCAA GGAACCATTG 960 

ATAAGCCGTT ATTTGATTTA TTAACAGTAT ATTTTTGAGT CGTTTTAACT TCTTTGCCTA 1020 

AGTTTTGAAC ATTTAAGTCT TTTACATTGA ACCAACCTAA TGGGATGTTA TGGCTTGTAT 1080 

TGTTTAATAA TACATACGTT TCATTACCAT GAGCACGCTC TTTTGTTACA TAGAACGTAC 1140 

15 GGTCTGCATA TTTCGCACCG TTTTTCGCTG TTTTTTCATA AACAGAAGCA CGAATACCAG 1200 

TGTTGTTTGG TTTAACTTGA GCAATCTTGC TAACTGTTTG AGTCGTTTGT GGTTTAGTAA 1260 

CAGTATAAGC TTTTACAGCT GTTTTTGGTT GTGCTACTGC TTTTTTAGGT GCAGCAGGTA 1320 

CAGCTAAATA TGCTTTACTT ACCCAACCAG ATTTACCATT TACAGTTCCA AATAAATAGA 1380 

TAGATTTATC AATTTGTTGT TGCTTAGTCG CTTTAAAAGT TTGGTTACCT GTACCAGAAA 1440 

CTGCACCAGC TTCTTGTTTA TAAGTGCCCC AAGGTACTGA ATATAATTTA GTGCCTGGgT 1500 

TTACTGTATA TGTTTGCATT ACATTTACAG GTGATTTTGC ATtGtTATAA ATACGTCACC 1560 

TTGTTTAACC CAACCAATTA AAGTTGGACT ATTGTAATCT TTAACTAAGT AGAATTTGTT 1620 

30 TCCACCTAAA CTTGCTTCTT TTGTTACAGC AAATGTTTTT TGAACTTCTT TCGTTGGCTT 1680 

ACCAGTTTTG TCATAAACTG TAGTGAATAA GCCATTGTTT TTAGCATTAA TTTGAGCAAC 1740 

ACCGTTTAAT GATGAAACTG TTAATTTATT ATTTGTTGTA GGTGTTGATG GCTTAGGTGT 18 00 

TGGTGTAGGC GTAGGTTTAG CAGTATCAAC TAAATATGCT TTACTTACCC AACCAGATTT 1860 

ACCATTCACA GAGCCATATA AATAAATTGA TTTATCAATT TGTTGTTGCT TTGAAGCCTT 1920 

AAATGTTTGG TTTCCAGAGC CAGACACACT ACCAGCAACT TGTTTAGATG TACCCCAAGG 1980 

TACTGTATAA AGTTTCGTAC CAGGTTTGAT TGAATATGAT TGATTTACAT TTACAGGTGA 204 0 

TTTAGCTGTG TTGTAAACCA CATCGCCTTC TTTAACCCAA CCAAATTTAT TACCAGAATT 2100 

45 GTAATCTTGA ACAAGATAGA ATTTTTGATT ACCTAATGTA GCTGTTTTAG ATACAGCAAA 2160 

TGTTTTTTGA ACTTCATTAG TTGCTTTACC AGTTTTGTCG TATACAGTAG TATATAAACC 2220 

ACTATTTGTT GG 2232 

50 

(2) INFORMATION FOR SEQ ID NO: 211: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2082 base pairs 

(B) TYPE: nucleic acid 
55 (C) STRANDEDNESS: double 



35 



40 
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(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 211: 

GATTTAAATA AAATTAATGG ATATCGTGAT CGTACGATGT TAGAACTTCT GTACGCAACG 60 

5 

GGAATGCGTG TATCTGAATT GATACATTTA GAGTTAGAAA ACGTGAACTT AATAATGGGA 120 

TTTGTACGCG TATTTGGTAA AGGCGATAAA GAAAGAATTG TACCATTAGG CGACGCAGTC 180 

10 ATTGAGTACT TAACTACTTA TATTGAAACG ATTAGACCGC AACTTTTAAA AAAGACTGTT 240 

ACTGAAGTCT TATTTTTAAA TATGCATGGT AAACCTTTAT CACGACAAGC AATATGGAAA 300 

ATGATTAAAC AAAATGGTGT AAAGGCAAAC ATTAAAAAGA CGTTAACGCC ACATACGTTA 360 

15 CGCCACTCTT TTGCGACACA TTTATTGGAA AATGGCGCAG ATTTAAGAGC AGTGCAAGAG 420 

ATGTtAGGtC ACTCTGaCmT ATCTACTACC CmaCTCTATA CmCATGTTTC GrAATCTCAA 480 

ATTAGAAAAA TGTATAACCA ATTTCATCCT AGAGCATAAA GTGAACAATA ACTCAAAAGT 54 0 

20 

CACAATACAC ATGACTAAAA ATGTCTGTGC TATTGTGGCT TTTTTAAATT GGTTGATTAA 600 

TTACGTCTAT GTTTTCTTAA TTGAATCGCT TCTTCTTTTG CTGCAATCAC TTCTGAACGA 660 

25 TCACGGCGCA TGTGATGGTC TACAATAAAA GGATCTGTTG CTGTTTCCTG ATTATAATCA 720 

TAGTCTGGAT AGTTGGCCTT GATGATGCGT TCAAAGACTG GAGTTATTGG TAATATAACA 780 

GATGAAAAAG GCTTTGCTGC ATTCAATTTT GCAATCTGTT GCTCAATTAA CAACTGATAA 84 0 

30 TCATTTAAAT TAAGGTATAA CGCATCTCTA TCTTTAGCAT TTTGTATTAT TTCTTTAGAT 900 

TTATTAAAAG ACTTATAGGC GCCTTTTAAA TTATTGCGGC GATAATGGTA ACAAGCAGTT 960 

GCAAACAAGA TTAAACTAAC AACTGCATCT TGCTTACTGT AGTTATTTTC AGCTTTCCAT 1020 

35 

GCATCTTCTA AAATGTCATG ACATAGGAAA TAATGTTGCT TAGTATGAAA TTGATAATAG 1080 

AAA-TTTATCA GTGCCTGTTG CATTTTGTTA TCACCCCAAT TTAAAAGTAA GTTATTTTCA 1140 

TGCTATAATA TTTTAGAGAA TTATGCACAT ATGACGCAAT ACGAGGTAGA TATTATGTAT 1200 

40 

GAAGTTAAAT TAGATGCTTT CAATGGACCA TTAGATTTAT TGCTGCATCT TATCCAAAAA 1260 

TTTGAAATAG ATATTTATGA TATTCCTATG CAAGCATTAA CAGAGCAGTA TATGCAGTAC 1320 

45 GTTCATGCAA TGAAACAGCT TGAAATTAAT ATTGCAAGTG AATACCTAGT ATTAGCGTCA 1380 

GAACTCTTAA TGATTAAAAG TAAGATGCTA TTACCACAAT CAACATCAGA TATGGATGTT 144 0 

OATGATGACC CACGGGAAGA TTTAGTtGGG CGTTTAATAG rATATCaAAA TTATArAGAA 1500 

50 

TATACTGCtA TTTTAAATGA CATGAAAGAA GAAAGAGATT TTTATTTTAC CAAAAAGACC 1560 

GACAGATTTA TCtCATTTGG AAAcAGATGA ATCyTGGGAT CCaAATCATA CGATTGATTT 1620 
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ATCTGTTGAA ATCCGAAAAG AGACATTTAC CATTCAACAA GCTACAGAAC AAGTGACATC 1740 

GAGATTGAAA GATAAAGATC ATTTTAACTT CTTTAGTCTG TTTACGTTTT CTGAGCCAAT 1800 

£ 

TGAACAAGTA GTCACTCACT TTTTAGCTAT TTTAGAGATG TCAAAAGCAG GAATAATTAA 1860 

TATTGAGCAA CAACGTAATT TTGAAGATAT TAACATTATT AGAGGAGTGA ACTACCATTT 1920 

w TGGATAATCA TGGTATATTA GAGTCGCTTT TATTTACAGC TGGCGATGAA GGTTTAGATG 1980 

AAAAACAACT ATTAGAAATA TTAGATATGT CGAAAGACCA ACTCGTTGAA TTAATTGAAA 2040 

ATTATTCATC ACATGGATTA ATGATACAAC GATTTGGAAT GA 2082 

15 (2) INFORMATION FOR SEQ ID NO: 212: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4219 base pairs 

(B) TYPE: nucleic acid 
20 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: I 

25 

TCTATTCTCG TTCTTCCAAG ACCCTGaATT 
AGAATCTATT AAAAAAGCTC AAAAAGGTAT 

30 CGAACAAGAT GATGATACAA AAGATACTGT 
CAAAAACACT CAAGAATATT GGGAAGAACG 
GCGTGATAAA ACTAAAGCTG AAGAAATAGA 

35 TGAAAAAGAG ATCaATGCGT TTATTGTCAA 
AGAAGCACAA AAGATTATTG ATGAGTTCGA 
. ATTGdTCGAA AACAAGGAGT TTAGCGATAG 

40 

GAAAATGTAT GTATCTAGAG AACAGATGTT 
TGCAACAGCT CAAACAGAAT TATCGATGAG 

45 GTTCAGTGAT CAAGCGGGTA TTTTAGGTGA 
TACAATCGTT GATACACAAT TTCATGGTGT 
CGAAGCAATG AAACAAGAAG TAGAAGAAAT 

so TCCTAATGAA TATGTTAAAG ATATGCGCAA 
CAAAAGACCG CAGCAATTAA ATCATTGCTT 
TCAAGCATTG ACAGCATGAA AGAAATTTCA 

55 



JEQ ID NO: 212: 

AGAAGTTAAG AAAATCGAAG AAGATGAGAA 60 

TTATAAAGAC CCTAGAGACA TCAATGATGA 120 

TGATAAAAAG GAATGATTGT AATTGCCTAA 180 

CGGACGCAAA GCAATCGAGA ATGAGTTGAA 24 0 

ACGTATATTG AATATGATGA TTAAGCGCAT 300 

GTACGGAGAT TTTGCAGGCG TTACATTACA 360 

TGTAAAAGCG TTTCAAGAAG AAGCAAAAAG 420 

AGCAAATGAA GAATTAAAGA AGTATAACAC 480 

AAAGATTCAA ATAGAATTCT TAATTGCTTA 54 0 

GGAATATTTC GAATCAACAG CTTATCGTGT 600 

AGGTGTACAA GTAGCTAAAG AAGTTATAGA 660 

CGTTTGGTCA GAGCGATTAT GGACTAATAC 720 

AATTGCTAAT GTAGTTATTA GAGGTCGACA 780 

CACTTAAATA AATTCGAAGG CACAGCACGA 840 

TATACGGAAT CGGCACGTGT TCACGCACAA 900 

CCGGAAGgAT ATTATATGTA TATTGCAAAA 960 
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GACGCTAAAA TTGGTGTTAA TTTCTATCCT ATGCATATCA ATTGTCGTTC AGATTGCGCT 


1080 




TTACTACCTA AATCTATGTG 


GCCGAAAAAA 


CCAAGCAAGA 


AACGAAAAAC 


AAAATACTTC 


1140 


5 


GGAGGGAAAG 


TGAAAAGCGG 


TGATTGATTT 


AAAAGTGAAG 


TTTTTTAAAG 


GCAAGTTAGT 


1200 




TTTGTATGAC AGTAAATTAA ATGTTTGGAG GATACTAATA TGAGTAATAC TGACAAATAC 


1260 


10 


CTTAGAGACA TAGCAAGAGA ATTAAAAGGT ATACGTAAAG AGTTACAAAA GCGAAACGAA 


1320 


ACAGTTATTA 


TTGATGCAAA 


CTTAGACAGT 


TTAAGGTCGG 


CAGTATTAGC 


CGATAAAGAA 


1380 




AAATCGAAAT 


ATAATGAACC 


TCTCTTTTAA 


TAGCTAGCAC 


TTAATTGTGT 


TGGCTATTTT 


1440 


15 


TTATGTCCAA 


AACGTGCTGA 


TGACATAAAA 


AGCACGCATG 


GAAAAACAGT 


CGACAGACTA 


1500 




TAAATGGAGG 


TATATCTCAT 


GGAAGAAAAT 


AAACTTAAGT 


TTAATTTGCA 


a TITTTTGPA 

Q A. A A A. A A \3\*~n 


1560 




GACCAATCAG 


ATGATCCGGA 


CGAACCAGGC 


' GGAGATGGTA AAAAAGGAAA 


TCCTGATAAfi 


1620 


20 


AAAGAAAATG 


ACGAAGGTAC 


TGAAATAACT 


TTCACGCCAG 


AGCAACAAAA 


GAAAGTTGAT 


1680 




GAAATACTTG 


AACGTCGTGT 


AGCCCACGAA 


AAGAAAAAAG 


CTGATGAGTA 


TGCAAAAGAA 


1740 


25 


AAAGCAGCAG 


AAGCTGCTAA 


AGAAGCTGCT 


AAATTAGCGA AAATGAACAA 


GGATCAAAAA 


1800 


GATGAATATG 


AACGCGAACA 


AATGGAAAAA 


GAACTGGAAC 


AATTACGTTC 


AGAAAAACAA 


1860 




TTAAACGAAA 


TGCGTTCAGA 


AGCACGAAAA 


ATGTTGAGTG 


AAGCGGaAGT 


TGATTCATCA 


1920 


30 


GATGrGGTTG 


TCAATTTAGT 


TGTAACAGAT 


ACTGCTGAAC 


AAACTAAATT 


GAATGTTGAA 


1980 




GCTTTTTCTA 


ATGCAGTAAA 


AAAAGCGGTT 


AATGAAGCGG 


TTAAGGTTAA 


CGCTAGACAA 


2040 




TCGCCATTGA 


CTGGTGGAGA 


TTCATTTAAT 


CACTCGACTA 


AAAATAAACC 


GCAAAACTTA 


2100 


35 


GCTGAAATAG 


CTAGACAAAA 


AaGAATTATT 


AAAAATTAAC 


GGAGGCATTT 


AAATGGAACA 


2160 




AACACAAAAA TTAAAATTAA ATTTGCAACA TTTTGCAAGT AACAATGTTA AACCACAAGT 


2220 




ATTTAACCCT 


GACAATGTAA 


TGATGCATGA 


AAAGAAAGAT 


GGCACGTTGT 


TAAACGACTT 


2280 


40 


TACAACACCT 


ATCTTACAAG 


AGGTTATGGA 


AAACTCTAAA 


ATCATGCAAT 


TAGGTAAGTA 


2340 




CGAACCAATG 


GAAGGTACTG 


AGAAGAAGTT 


TACTTTTTGG 


GCTGATAAAC 


CAGGTGCTTA 


24 00 


45 


CTGGGTAGGT 


GAAGGTCAAA 


AAATCGAAAC 


GTCTAAGGCT 


ACTTGGGTTA 


ATGCTACAAT 


2460 


GAGAGCGTTT 


AAATTAGGGG 


TTATCTTACC 


AGTAACAAAA 


GAATTCTTGA 


ATTACACTTA 


2520 




TTCACAATTC 


TTTGAAGAAA 


TGAAACCTAT 


GATTGCTGAA 


GCTTTCTATA 


AAAAGTTTGA 


2580 


50 


CGAGGCAGGT 


ATTTTGAATC 


AAGGTAACAA 


TCCGTTCGGT 


AAATCAATTG 


CACAATCAAT 


2640 




TGAAAAAACT 


AATAAGGTTA 


TTAAAGGTGA 


CTTCACACAA 


GATAACATTA 


TTGATTTAGA 


2700 




GGCATTGCTT 


GAAGATGACG 


AATTAGAAGC 


AAATGCATTT 


ATCTCAAAAA 


CACAAAACAG 


2760 
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TGATTCGTTA GACGGTCTAC CTGTGGTTAA CCTTAAATCA AGCAACTTAA AACGTGGTGA 2880 

ATTAATCACT GGTGACTTCG ACAAATTGAT TTATGGTATC CCTCAATTAA TCGAATACAA 2940 

5 AATCGATGAA ACTGCACAAT TATCTACAGT TAAAAACGAA GATGGCACAC CTGTAAACTT 3000 

GTTTGAACAA GACATGGTGG CATTACGTGC AACTATGCAT GTAGCATTGC ATATTGCTGA 3060 

TGATAAAGCG TTTGCTAAGT TAGTTCCTGC TGACAAAAGA ACAGATTCAG TTCCAGGAGA 3120 

10 

AGTTTAATAA ATAATTAGGA GTGGTAACAT GCCCGAAATC ATTGGAATTG TTAAAGTAGA 3180 

TTTTACAGAT TTAGAAGATA ACAGACATGT CTATATGAAA GGGCATGTCT ACCCTCGTAA 3240 

15 AGGTTATAAT CCTACAGATG AACGTATCAA AGCTTTAGCT AGTGTTGAAA ATAAACGCAA 3300 

CAAACAAATG ATTTACATTG TAAATGACAA ATTAACCAAA AAAGAACTTG TCGAAATAGC 3360 

AAGTGTTGCT GGCTTACAAG TTGATGAAAA ACAAACAAAA GCTGAAATTA TCAATGCTTT 3420 

20 TGAGTCACTA GAGTAGGTGG TTATATGACT ACGCTAGCTG ATGTAAAAAA ACGTATTGGT 34 80 

CTTAAAGATG AAAAGCAAGA TGAACAATTA GAAGAAATCA TAAAAAGTTG TGAAAGCCAG 3540 

TTGTTATCAA TGTTACCTAT TGAAGTTGAA CAAATACCGG AAAGgTTTAG TTACATGATT 3600 

25 

AAAGAAGTTG CAGTTAAACG CTACAACAGG ATTGGTGCTG AAGtATGACA TCAGAAGCGG 3660 

TTGACGGACG TAGCAATGCG TATGAATTGA ACGATTtCAA GGAGTATGAA GCTATTATTG 3720 

ATAATTACTT TAATGCTAGA ACGAGAACTA AAAAAGGAAG GGCTGTGTTC TTTTGAGATA 3780 

30 

TGAAGATAGA GTTATTTTTC AATTAGAACA AGTAGCAACT TACAATCCTA AAACTAGCAA 3840 

AAAAGAAAAC ACACTAATCA CTTATGATGC GATACCATGC AATATTAACC CCATTTCTAG 3900 

35 AGCAAGAAAG CAACTTGAAT TTGGTGATGT AAAAAACGAT GTAAGTGTTC TGAGGATAAA 3960 

AGAATCAATA TCTTACCCTG TTAGCCACGT GTTGGTTAAT GGCATTCGCT ACAAGATAGT 4020 

TGATACAAGG ATATACAGAC ACGAAACGTC ATATTATATC GAAGAGGTCA ATTGATGAAT 4080 

40 ATAGATGGAT TAGACGCACT GTTAAACCAA TTTCACGATA TGAAAACCAA CATTGATGAT 4140 

GATGTAGATG ATATTTTACA GGAAAACGCC AAAGAATATG TAGTACGAGC TAAATTGAAA 4200 

GCTAGAGAAG TAATGAATA 4219 

45 

(2) INFORMATION FOR SEQ ID NO: 213: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1999 base pairs 
so (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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GCTTACAAGT ATATTCATAA TTACATATTC AAGGTCCTTG CATGTGGTAT TTTGCTATGG 60 

yCtTTaACTA CAACGGGGTC TAAGACTGCG TTTATCATAT TAATCGTCTT AGCCATTtAT 120 

TyCTTTATkA AAAAGTTATT TAGTAGAAAT GCGGTAAGTG TTGTGAGTAT GTCAGTGATT 180 

ATGCTGATAT TACTTTGTTT TACCTTTTAT AATATCAACT ACTATTTATT CCAATTAAGC 240 

GACCTTGATG CCTTACCGTC ATTAGATCGA ATGGCGTCTA TTTTTGAAGA GGGCTTTGCA 300 

TCATTAAATG ATAGTGGGTC TGAGCGAAGT GTTGTATGGA TAAATGCCAT TTCAGTAATT 360 

AAATATACAC TAGGTTTTGG TGTCGGATTA GTGGATTATG TACATATTGG CTCGCAAATT 420 

AATGGTATTT TACTTGTTGC CCATAATACA TATTTGCAGA TCTTTGCGGA ATGGGGCATT 4 80 

TTATTCGGTG CATTATTTAT CATATTTATG CTTTATTTAC TGTTTGAATT ATTTAGATTT 54 0 

AACATTTCTG GGAAAAATGT AACAGCAATT GTTGTAATGT TGACGATGCT GATTTACTTT 600 

20 TTAACAGTAT CATTTAATAA CTCAAGATAT GTCGCTTTTA TTTTAGGAAT TATCGTCTTT 660 

ATTGTTCAAT ATGAAAAGAT GGAAAGGGAT CGTAATGAAG AGTGATTCAC TAAAAGAAAA 720 

TATTATTTAT CAAGGGCTAT ACCAATTGAT TAGAACGATG ACACCACTGA TTACAATACC 780 

CATTATTTCA CGTGCATTTG GTCCCAGTGG TGTGGGTATT GTTTCATTTT CTTTCAATAT 840 

CGTGCAATAC TTTTTGATGA TTGCAAGTGT TGGCGTTCAG TTATATTTTA ATAGAGTTAT 900 

CGCGAAGTCC GTTAACGACA AACGGCAATT GTCACAGCAG TTTTGGGATA TCTTTGTCAG 960 

TAAATTATTT TTAGCGTTAA CAGTTTTTGC GATGTATATG GTCGTAATTA CTATATTTAT 1020 

TGATGATTAC TATCTTATTT TCCTACTACA AGGAATCTAT ATTATAGGTG CAGCACTCGA 1080 

35 TATTTCATGG TTTTATGCTG GAACTGAAAA GTTTAAAATT CCTAGCCTCA GTAATATTGT 1140 

TGCGTCTGGT ATTGTATTAA GTGTAGTTGT TATTTTTGTC AAAGATCAAT CAGATTTATC 1200 

ATTGTATGTA TTTACTATTG CTATTGTGAC GGTATTAAAC CAATTACCTT TGTTTATCTA 1260 

TTTAAAACGA TACATTAGCT TTGTTTCGGT TAATTGGATA CACGTCTGGC AATTGTTTCG 1320 

TTCGTCATTt AGCATACTTA TTACCAAATG GACAGCTCAA CTTATATACT AGTATTTCTT 1380 

GCGTTGTTCT TGGTTTAGTA GGTACATACC AACAAGTTGG TATCTTTTCT AACGCATTTA 1440 

ATATTTTAAC GGTCGCAATC ATAATGATTA ATACATTTGA TCTTGTAATG ATTCCGCGTA 1500 

TTACCAAAAT GTCTATCCAG CAATCACATA GTTTAACTAA AACGTTAGCT AATAATATGA 1560 

50 ATATTCAATT GATATTAaCA ATACCTATGG TCTTTgGTTT AATTGCaATT ATGCCATCAT 1620 

TTTATTTATG GTTCtTTGGT GAGGAATTCG CATCAACTGT CCCATTGATG ACCATTTTAG 1680 

CGATACTTGT ATTAATCATT CCTTTAAATA tGTTGaTAAg CaGGCAATAT TTAtTAAtAG 1740 
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TATGTAyTAT TTTGATATAT 


TTTTATGGAA 


TTTACGGTGC 


TGCTATTGCG 


CGTTTAATTA 


1860 




CAGAGTTTTT 


CTTGCTCATT 


TGGCGATTTA 


TTGATATTAC 


TAAAATCAAT 


GTGAAGTTGA 


1920 


5 


ATATTGTAAG 
TGGTCAATCA 


TACGATTCAA 
TTATTTGCC 


TGTGTCATTG 


CTGCTGTTAT 


GATGTTTATT 


GTGCTTGGTG 


1980 
1999 


10 
15 


(2) INFORMATION FOR SEQ ID NO: 214: 








f (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7769 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 










(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 214: 






20 


TCATTATTAA 


GACTATTATA 


TATAATGAAT 


TTTAACTGGT 


TTATTAAACG 


AGAACGTCGG 


60 




GAATTAAGTA 


ACTACAATAA 


AAATAAGATA 


TGACAATAAG 


GAGACTACAC 


GCGTGATCAT 


120 




TGCCATAATT 


ATATTGATAT 


TTATTTCGTT 


TTTCTTTTCA 


GGAAGCGAGA CGGCATTAAC 


180 


25 


GGCTGCCAAT 


AAAACAAAAT 


TTAAAACTGA 


AGCTGACAAA 


GGTGATAAAA 


AAGCAAAAGG 


240 




CAT. ICjIAAAky 






GTTTATTACA 


ACGATTCTAA 


TTGGGAATAA 


300 


30 


TGTCGCGAAT 


ATTTTATTAC 


CAACACTTGT 


TACAATTATG 


GCTTTACGTT 


GGGGGATTAG 


360 


CGTTGGTATT 


GCATCAGCTG 


TTTTAACAGT 


TGTTATCATT 


TTGATCTCCG 


AAGTGATTCC 


420 




CAAGTCTGTC 


GCTGCAACAT 


TTCCAGATAA 


AATAACAAGG 


CTTGTATATC 


CAATTATTAA 


480 


35 


TATTTGTGTC 


ATTGTGTTCC 


GTCCTATCAC 


ATTACTTTTA 


AATAAGTTGA 


CGGACAGTAT 


54 0 




TAATCGAAGT 


TTATCTAAGG 


GCCAACCTCA 


AGAACATCAA 


TTTTCAAAAG 


AAGAATTTAA 


600 




AACAATGTTA 


GCAATTGCTG 


GACATGAAGG 


TGCTTTAAAT 


GAAATTGAGA 


CGAGTAGGTT 


660 


40 


GGAAGGTGTC 


ATTAATTTTG 


AAAATTTAAA 


AGTAAAAGAT 


GTAGATACAA 


CACCTAGAAT 


720 




TAATGTGACG 


GCATTTGCTT 


CAAATGCGaC 


ATACGAAGAA 


GTTTATGAAA 


CGGTTATGAA 


780 


45 


TAAGCCATAC 


ACTAGATATC 


CAGTGTACGA 


GGGAGATATT 


GATAACATTA 


TTGGGGTGTT 


840 


TCATTCTAAA 


TATCTGTTGG 


CTTGGAGTAA 


TAAAAAAGAA 


AATCAAATTA 


CAAACTATTC 


900 




AGCTAAGCCA 


TTATTTGTGA 


ATGAACACAA 


TAAAGCTGAA TGGGTATTAC 


GTAAGATGAC 


960 


50 


TATTTCTAGA 


AAACATTTAG 


CAATTGTGTT 


GGACGAATTT 


GGTGGTACTG 


AAGCGATAGT 


1020 




GTCACATGAA 


GACTTAATTG 


AAGAATTATT 


AGGTATGGAA 


ATTGAAGATG 


AGATGGATAA 


1080 




AAAGGAAAAA 


GAAAAACTTT 


CTCAACAGCA 


AATTCAATTT 


CAACAACGGA 


AAAATCGCAA 


1140 
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GTATTGAATA TCCAATTATA CAAGCAGGTA TGGCAGGAAG TACGACACCG AAATTAGTTG 1260 

CATCAGTAAG TAACAGTGGT GGGTTAGGCA CAATAGGCGC AGGTTACTTT AATACGCAGC 1320 

AATTGGAAGA TGAAATAGAT TATGTACGCC AATTAACGTC AAATTCTTTT GGCGTAAATG 1380 

TCTJTGTACC AAGTCAACAA TCATATACCA GTAGTCAAAT TGAAAATATG AATGCATGGT 1440 

TAAAACCTTA TCGACGCGCA TTACATTTAG AAGAGCCGGT TGTAAAAATT ACCGAAGAAC 1500 

AACAATTTAA GTGTCATATT GATACGATAA TTAAAAAGCA AGTGCCTGTA TGTTGTTTTA 1560 

CTTTTGGAAT TCCAAGCGAA CAGATTATAA GCAGGTTGAA AGCAGCGAAT GTCAAACTTA 1620 

, 5 TAGGTACAGC AACAAGTGTT GATGAAGCTA TTGCGAATGA AAAAGCGGGT ATGGATGCTA 1680 

TCGTTGCTCA AGGTAGTGAA GCAGGTGGAC ATCGTGGTTC ATTTTTAAAA CCTAAAAATC 1740 

AATTACCTAT GGTTGGAACA ATATCTTTAG TGCCACAAAT TGTAGATGTC GTTTCAATTC 1800 

20 CGGTCATTGC CGCTGGTGGA ATTATGGATG GTAGAGGAGT TTTGGCAAGT ATTGTCTTAG 1860 

GTGCAGAAGG GGTACAAATG GGCACCGCAT TTTTAACATC ACAAGACAGT AATGCATCAG 1920 

AACTACTGCG AGATGCAATT ATAAATAGTA AAGAAACAGA TACAGTCATT ACAAAAGCGT 1980 

TTAGTGGAAA GCTTGCACGC GGTATCAACA ATAGGTTTAT CGAAGAAATG TCCCAATACG 2040 

AAGGCGATAT CCCAGATTAT CCAATACAAA ATGAGCTAAC AAGTAGCATA AGAAAAGCCG 2100 

CAGCAAACAT CGGCGACAAA GAGTTAATAC ATATGTGGAG TGGACAAAGC CCGCGACTAG 2160 

CAACAACGCA TCCCGCCAAC ACCATCATGT • CCAATATAAT CAATCAAATT AATCAAATCA 2220 

TGCAATATAA ATAATCGACC GCAATCCACA AAAGCACAAG CACCCCCAAA CATTATTTTA 2280 

35 GTGCTTGCCA TTTTTGTGGA TTGCGTTTCT ATTTTACCAA TTTAATCAAA CGAAAACATC 2340 

AAGCTGAAGA TCGCCGAAAG ATTTTAATCA AGCAAAAACA TCAAACTAAA GTTCGCTGAA 24 00 

ATGATTATGA TAAAAGTTAT ATGGTATGAT GACATTGGTG ATATATATGA TAAACATCGG 2460 

ATTAACAGGT TGGGGTGATC ACTATTCATT ATATGAAGAT TTAGAACGCC AAACCGATAA 2520 

ACTTAAAACA TATGCTGGAC ATTTTCCGGT TGTCGAATTA GATGCGACAT ACTATGCGAT 2 580 

ACAACCGGAA AGAAATATAT TGAAATGGAT AAAAGAAACG CCTGATACAT TTGAATTTGT 2640 

GGTCAAAATT CATCAAGCAC TcACATTGCA TGCAGACTAC AAAACATTTG CAGATACAAG 2700 

GCAAGAACTA TTTGATCAAT TTAAGAATAT GTTAGAGCCC TTACATACAC AGAAAAAATT 2760 

AGCAATGGTA TTGGTTCAAT TTCCGCCATG GTTTGACTGC AATGCACAAA ATATCAAATA 2820 

TATTTTGTAT GTAAGACAGC AATTACAAGC ATTTCCAATG TGTGTAGAAT TTAGGCATCA 2880 

ATCATGGTTT AGTGATGCAT TTAAAGAACA AACATTGGCA TTTTTAACAG AACATCAAAT 2 940 

55 



25 



30 



40 



45 



SO 



959 



AATCACAAAT GAAATTGCGT TTGTACGTTA 
GAAAGATATG TCAGATCAAG AATGGCGCGA 
5 AGAATTAATA GACTTGGCAC AAAAGGCACA 

CGTCATATTT AACAATAATT CTGGTGGTCA 
ATTATTGAAT ATAGAATATG AAGGGTTAGC 

10 

GACGACTATG TTATTAACAA TTACATTATT 
AGGGTCTATC GTAGGCATTG GAGGCGGTAT 

1S TGTTGAACAT GGATTACTAC ATAATATTAC 
CATTCTAATT GTGACAGGAC TTTCTTCATC 
TATTAAAAAT GGTTCCATCT TTTTATTTGG 

20 CATTAGTAGA TATTTAACAT TTGAGTCATT 

CGTAGCCATT TTATTAATGG TAAGAAATAA 
CAAGTATGAA AAGACTTATG TAGACGCTAA 

25 

ATTGTTTGCT TTTATTACAA CGTTTTTAAT 
AGGTGGCGCA CTAATGACGC CACTAATGCT 
TGTTGGAACA AGTATGATGA TGATTTTCTT 

30 

TGCTCAAGGT CACGTAGCTT GGGGTTATGC 
TGCGAAAATC GGTGTCAAAG TGAATCAATC 

35 GAGAACAGTA ATGTTGTTAA TGGGTATATA 
CTTTAAAAGG AGGACGTCAA TTTGAGGCTT 
CATTTACATG AATACGAACG CATTAAAGCA 

40 CATCCTTCTT TATATGTTGA TCTAGGTGAT 
GCAACTTTAG GTAAAAAGAA TGTGGCATTA 
ATCGGTAATA ATGAAGGGAT GACCATTTCA 

45 

GCAAAATTTA TAGTGACATG TAGCAATGTT 
ATCGTTTCTT CTTATATTAA GGACATAGAC 
SQ GCACCTTTTA CCCCATTTTA TCGTGCACTA 
ATAAAAGAAG AAATTGAACT TCAACGAGGT 
TGTGGCATTT TCTTCGATGA AACATTATGC 

55 
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TCATGGACGT AATCATTACG GTTGGACTAA 3060 

TGTACGCTAT TTATATGATT ATAATGAGCA 3120 

AATATTAGCA CAAAAAGCTA AGAAAGTTTA 3180 

TGCAGCAAAT AATGCCAAAA CATATCAGCG 3240 

ACCACAACAA TTAAAATTAT TTTAAGAGGC 3300 

AGTTTTAATC GGAGGTTTGT CAGCGATTAT 3360 

TATTATCGTT CCAACAATGG TTTACCTCGG 3420 

AACACAAGTA GCGATAGGGA CGTCTTCAGT 3480 

ACTTGGATAT TTAAAAACAA AACAAGTTGA 3540 

ACTATTACCA GGTTCATTGC TTGGGTCCTT 3600 

TAATTTATAT TTTGGTATCT TTTTAATTTT 3660 

GATTAAACCG TTTAAAATTT TCGATAAACC 3720 

AGGTAAAACA TATCATTATA gTGTTCCACC 3780 

TGGTATATTG ACAGGTTTAT TTGGTATTGG 384 0 

TATTGTATTT AGATTTCCAC CTCATGTAGC 3 900 

TTCAAGTGTC ATGAGTTCTA TAGGGCACAT 3960 

AATCATnTTA ATTATTTCTA GTTATTTTGG 4020 

AATTAAGTCA GATACGGTAG TAACATTATT 4080 

TTTAATTATT CGTGCGTTGA TTTAATACAA 414 0 

ACAATTTATC ATACGAACGA TATTCATAGT 4200 

TATATGGCAG AACATCGGCC ACGACTTAAT 4260 

CATGTAGATT TATCCGCACC TATAACTGAA 4320 

CTAAATGAAG CAAAATGTGA TGTTGCAACA 4380 

TACGAAGCTT TAAATCACCT TTACGACGAA 4440 

ATAGATGAAT CAGGTCATTT ACCAAATAAT 4500 

GGTGTGAAAA TACTATTCGT TGCAGCGACA 4560 

AATTGGATTG TTACCGATCC ACTTGAATCT 4620 

AAATTTGATG TATTAATCGT GCTAAGTCAT 468 0 

CAAGAATTGC CTGAAATTGA TGTCATTTTT 4740 
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GCAgCTGGAA AGTATGGTAA TTATCTTGGA GAGGTTAATT TAACTTTTGA GGCACATAAA 


4860 




GTAGTACATA AAACTGCAAA GATTATTCCT 


TTAGAAACAT 


TACCTGAAGT 


TGAAACTTCA 


4920 


5 


TTTGAAGAAG 


AAGGAAAAAC 


GTTAATGTCC 


AATTCAGTAA 


TTCAACATCC 


AGTAGTGCTT 


4980 




AAGCGTAGTA 


TGAATCACAT 


AACTGAAGCT 


GCATACTTAT 


TAGCTCAAAG 


TGTTTGTGAG 


5040 


10 


TATACACATG 


CACAATGTGC 


CATCATCAAT 


GCTGGCTTAC 


TCGTTAAAGA 


TATTGTAAAA 


5100 


GATGAAGTGA 


CAGAATATGA 


CATTCATCAA ATGTTACCGC 


ATCCGATTAA 


TATGGTAAGG 


5160 




GTTAGACTTT 


TTGGTGTGAA 


ATTAAAAGAG 


ATTATAGCTA 


AAAGTAATAA 


ACAAGAATAT 


5220 


15 


ATGTATGAAC 


ATGCACAAGG 


TTTGGGTTTC 


AGAGGGAATA 


TATTTGGAGG 


ATATATTCTT 


5280 




TATAATTTAG 


GGTACATTCA 


TTCTACAGGG 


CGTTACTATC 


TGAATGGAGA 


AGAAATCGAA 


5340 




GACGACAAAG 


AATATGTACT 


AGGTACGATA 


GATATGTATA 


CGTTCGGTCG 


TTATTTCCCA 


5400 


20 


ACATTGAAAG 


AATTACCAAA 


AGAGTATTTA 


ATGCCAGAGT 


TTTTAAGAGA 


TATATTTAAA 


5460 




GAAAAATTAT 


TGGAATATTA 


AAAAGTAAGA 


TTATTGGATT 


TTCATTTGTC 


ATG AATTT CG 


5520 




ATATAATGTT 


TAAAGATACA 


CTTAACAGGA 


GGGTATGTGT 


TGTTATGGCG 


ACAAAAAACG 


5580 


25 


AGGAAATATT 


ACGTAAACCG 


GATTGGTTGA 


AAATAAAATT 


AAATACCAAC 


GAAAACTATA 


5640 




CAGGACTTAA 


GAAGATGATG 


AGGGAAAAAA 


ATCTTAATAC 


TGTATGTGAA 


GAAGCTAAAT 


5700 


30 


GTCCTAATAT 


ACATGAATGT 


TGGGGTGCAC 


GTCGTACAGC 


GACATTTATG 


ATTTTAGGTG 


5760 




CCGTATGTAC 


AAGAGCTTGT 


CGTTTTTGTG 


CGGTTAAGAC 


AGGTTTACCT 


AATGAACTTG 


5820 




ATTTAAATGA 


GCCTGAACGT 


GTAGCTGAAT 


CAGTTGAATT 


AATGAATTTG 


AAACACGTTG 


5880 


35 


TTATCACTGC 


TGTTGCGCGT 


GATGATTTAA 


GAGATGCTGG 


TTCAAATGTT 


TATGCTGAGA 


5940 




CAGTACGTAA 


AGTTAGAGAA 


AGAAATCCAT 


TTACAACGAT 


TGAAATTTTA 


CCATCAGATA 


6000 




TGGGCGGGGA 


CTATGATGCG 


TTAGAAACAT 


TAATGGCGTC 


AAGACCTGAC 


ATTTTAAACC 


6060 


40 


ATAATATTGA 


AACTGTTCGT 


CGCTTAACAC 


CGAGAGTTCG 


TGCGCGTGCG 


ACTTACGACA 


6120 






C TTTTT &. C(~"T 
Iji 1 1 1 InLul 


CGTTCAAAAG 


AATTACAACC 


GGATATCCCA 


ACTAAATCAA 


6180 


45 


GTATTATGGT 


TGGATTAGGT 


GAAACTATAG 


AAGAAATTTA 




UATGATTTAC 


6240 


GTGCGAATGA 


TGTAGATATT 


TTAACGATTG 


GTCAATATTT 


ACAACCTTCA 


CGTAAACATT 


6300 




TAAAGGTTCA 


AAAATATTAC 


ACGCCTTTAG 


AGTTTGGTAA 


ATTAAGAAAA 


GTGGCAATGG 


6360 


50 


ATAAAGGGTT 


TAAACATTGC 


CAAGCTGGAC 


CTTTAGTACG 


TAGTTCTTAT 


CATGCGGATG 


6420 




AGCAAGTAAA 


TGAAGCTGCT 


AAAGAAAAGC 


AACGCCAAGG 


TGAGGCACAG 


TTAAATAGTT 


6480 




AATATTTAAC 


CATTAATAAG 


GCATAAAGGC 


TTAGTTTGTA 


CAAAACGAAC 


GTGTCATAGA 


6540 
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AGGTGAAGAA 


TTTGATAAAA 


GTAGATCAAC ATTACTTTGA ATTAATAGAA AATTATCGCG 


c c £ n 


AATGTTTTAA 


TGAAGAACAA 


TTTATTGCTA GGTATTCAGA TATTTTAGAT AAATATGATT 




ACATAGTTGG 


TGACTATGGT 


TACGATCAAT 


TACGATTAAA 


AGGTTTTTAC 


AAAGATTCTA 


C"7 Q A 
b / OU 


ATAAAAAAGC 


AGAGATGAGT 


AAACGT1TIT 


CAAATATTCA 


AGATTACATA 


TTTGAATATT 




GTAACTTTGG 


TTGTCCTTAC 


TTTGTATTAA 


GACATTTGTC 


TAAACAAGAG 


GTTAAAAAGT 


c a n n 
b?UU 


TAATCGAAGA 


AGTTCATCCG 


TCTGATGTGA 


TAGATGACGA 


CAATAAACTT 


CAAGATGTGA 


c a c ft 
D7O0 


AGATTAAGCC 


AACCATTCAA 


GATACTGAAC 


ATTAATAAAA 


CCCTTAGCTA 


GATTGAAAAT 


7020 


GGGAATCATG 


CAATTCAAGC 


ATGGACCTGT 


AATCTAGTTA 


GGGGTTTTTA 


TCTTTAATGA 


7080 


ATGACTTCAT 


TTAAATACTC 


AflTAATTTCA 


TCGCCTTCTT 


CAGCATTTAC 


ACCTAAAATA 


7140 


TGAGCGATAT 


AGCCTTCTTC 


111 innni Wi 


TCAGTACCGA TAATACCGAA 


TTTATTTGTT 


7200 


TGCATATTAA 


GTACGAGTGT 


CTTAC C!AT AA 


TGTCTATTTG 


TATGGACTAA 


CATCAAATCA 


7260 


TATCGACTAT 


GCTCGCCAAC 


AAAACCAACA 


AACTGAACTT 


GACTCTCTTC 


GTTGTCATCA 


7320 


TATAAATACA 


TATCAATCAT 


TTTGTAGCGA 

ill w x. nvjv nj^» 


CTCCTTTTAA 


AAGTAGTAAA 


GTTAGTATAA 


7380 


CGACAAATGA 


AGTATACTGC 


AAAATTATGA 


TAATATATAA 


GTGAGAGGTG 


ACAAGGAATG 


7440 


TATTTTGTAG 


ACAAAGATAA 


ACTAACTCAG 


AAATTAGCCT 


ATTTACAAGC 


ATTAACTGAT 


7500 


GATTATCATG 


AGAGCAAGCA 


CAATCATTAT 


GCATTTGAAC 


GCATTGCTCA 


AATGTTGATA 


7560 


GAATCATCGG 


TAGATATAGG 


GAATATGATT 


ATCGATGCAT 


TTATTTTAAG 


GGATCCTGGT 


7620 


AATTATAAAG 


ATGTGATTGA 


TATATTAGAA 


CTAGAAAATG 


TTATTACTAA 


AGAAACACAG 


7680 


CAGGCGATTA 


ATAAAACTGT 


CGGTATTCGT 


AAACAATTTA 


CATATGATTA 


CACAGCCTTA 


7740 


GATGTTGAGA 


TTATCATGCC 


i 

AATGTTTGA 








7769 



(2) INFORMATION FOR SEQ ID NO: 215: 

40 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 644 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

45 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 215: 
50 ACCGCCACCC ATTAATGATT GCTTAAAATC AATAGTCGTA CCATTTAATA CGGGTGCATC 60 

TTTTTTGTCT ACTAATACTT TTAATCCAAA GTATTCTAAG ACTTCATCAT TTTCACCAGG 12 0 

CGCTTCTTCT GCACCCATAC CGTATGTTAA ACCAGTGCAC CCGCCACCAT TCACTTTAAT 180 

55 
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TGCTTCTGTT AATATAACTG TTGGCATGAT AACTCCTCCT TAAAAAATCC AAGTTTCTTT 300 

TATATGTGCA TATATATTTT GTAATAATTC TTCCGGCGAA TCACCTTCAA CAATATCACC 360 

5 

ATTTACTAAA GCATACAACC CGGCTGAACA TATACCACAA TGTGTCAGGC AACCATACTC 4 20 

TAACACATCG ACATCTGGGT CATTTTCCAG TTGATTAAAA ACATAATCTC CACCTTTTGC 4 80 

CATGTTAGAG AGACAAAATT CTACGATCGG ATTCATACTT CACCTTCTTA TTTCATTTGT 54 0 

10 

TACAATATTA TAGCATTTTA AAACTGGTAT TTTAACATGA TGTGCTCAAT TAGCAACAAC 600 

TGATGTTTCT TATCCCAGTT ATGTAATAGT GCCTTAGTTA GTAC 644 
15 (2) INFORMATION FOR SEQ ID NO: 216: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1578 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 216: 

25 

GAATGATGAA AGGAATAGAA AAGAAAAGAT AAATAATGTA ATAGATTTAT CCGAGAAAAT 60 

TGAAAGAACA AAAGATATGC CAATCAAGAA TACTATAACT ACTCAATTAG GAAATAAACT 120 

3Q TATTGGCACA AAAAAAGCTC GTTTTGATGA TAAGAAAGTA GTGTCGTTTG GAGCATTTGA 180 

AGATGAATAA AATAAATGAT AGAGATTTAA CAGAATTGAG TAGCTATAGG GTTTATCAAG 24 0 

ACATCAATAA AGATAATGAC TTTACAGTTA ACGAAAAACG ATTTAAGCAG GCAGATGTAT 300 

35 TTGAAGATTT ATATAGAGAG AAACTAAAAG ACACAAATAA ATTAAGAGAG TATAATTATT 360 

TACAAAATGA AACTTTTAAA AGCGCATAAA TAGGTGATGA GATATGCTTA AAAAAGCAAA 420 

ATTT&TCTTA ATGGCAACGA TACTACTATC AGGATGTTCA ACTACCAATA ACGAATCCAA 480 

40 

CAAAGAAACA AAATCTGTAC CAGAAGAAAT GGATGCTTCA AAATATGTAG GACAAGGATT 540 

CCAACCACCT GCAGAAAAAG ATGCGATTGA ATTTGCAAAG AAGCATAAAG ATAAAATTGC 600 

TAAGCGAGGC GAACAATTTT TTATGGATAA CTTCGGTCTA AAAGTTAAAG CTACAAATGT 660 

45 

TATAGGTAGT GGCGATGGTG TAGAAGTATT CGTGCATTGT GATGACCACG AyATCGTATT 720 

TAATGCGAGT ATTCCATTTG ATAAATCAAT wATTGAsAGT GATAGCTCAT TAAGAAGTrA 780 

so GGAyAAAGGy GATGATATGA GTACTTTAGT TGGTGCAGTA CTCAGTGGGT TTGAATATCG 84 0 

AGCACAAAAA GAAAAATATG ATAAATTATA TAAATTTTTC AAAGATAATG AAGAGAAATA 900 

TCAATATACA GGATTTACAA AAGAAGCAAT TAATAAGACG CAAAATAGTG GTTATGAAAA 960 
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ACCATTGTTA 


AACAAAAGTG 


ACAGTGAATT 


TTCAAAAGAA TTGTCAAATG TTAAGAAGCA 


1080 


5 


ATTAAAAGAT 


AAGTCTAAAG 


TTTCGGTAAC 


TACTACTCTA TTTAGTAAAA AAAAGAACTA 


1140 




TACTAAAAAA 


AGTAACAGTG 


AAAATGTAAT 


AAAAATGGCA GAAGAAATAA AAAAAGATAA 


1200 




AGAGATACCA AACGGTATAG 


AGCTTAGTAT 


AAAATTTTCG GACAATAAAA TAAATACGGT 


1260 


10 


TAAACCAAAT 


TTTAACGGTG 


aAAGCACTTC 


AGAATATGGT GTGTTTGATC AAGAATAAAA 


1320 




TTAATGATGa 


AAATTTAACG 


GAGAATAGTG 


TATATTGAGT AGATCmAGAA TAAAAAGATA 


1380 




ATT CT ACT AT 


TGTTGTGAAG 


GCAAATAAGT 


AGAAGATTTT AAGTGTAATT TCTGGTGATT 


1440 


15 


TAAATAATAA 


TATAnATGGn 


AGTACTGATA 


TAAnACTTTT TAACCTACTA GATTCTTATA 


1500 




ATTTGCTTTC 


CATTTTATGA 


CGATTTTTAC 


TCCAATTGAG TGATAGAATC CAAAAAAGCC 


1560 


20 


ATCTCCAAAA 


ATTAATCC 






1578 


(2) INFORMATION FOR SEQ ID NO: 217: 




25 


(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5137 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 




30 


(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 217: 






TGTTTTCCTT 


GGGTTAAAAC 


ATGCTTGCTA 


TGCGTTTGTA AATATGACTT GCTGTTTTnA 


60 




CCTGnATACC 


CGTCACACCA 


TGGAAGTAAA 


AATGTTTCTT GCTCTTGGCT TACAATTTTA 


120 


35 


GCTTTAATCG 


CTTCATATGC 


TTTATATTGG 


TCTTCTGTTA ATTGCTGTTT TGATTCTTGT 


180 




TCGAAAACAC 


GATCTTTAAA 


TGGGTCTCTT 


TCAACAACCG CGTCATATTT TTCAACATAA 


240 


40 


CCTTTTTTGA 


TAAGTCCATC 


TAAACTGGAT 


TTTGAAAAGC CCATATCCTC AATATCAGTT 


300 


AAAAATATTG 


TTTTATGTTG 


TTCTTCAGAC 


AAGTAAGCAT ACAAATCGTA TTGTTTAATA 


360 




ACTTTCTCCA 


ACTTAGCTAA 


TACTTCATCA 


GGATGATACC CTTCAATGAC ACGAACAGCA 


420 


45 


CGCTTGGTTT 


TTTTAGTTAT 


ATTTTGTGTG 


AGAATCGTTT TTTCTTCAAC GATATCATCT 


480 




TTTAACAACT 


TCATAAGCAA 


TTGAATATCA 


TTATTTTTTT GCGCATCTTT ATAATAATAG 


54 0 




TAACCATGCT 


TATCAAATTT 


TTGTAATAAA 


GCTGAAGGTA GCTCTATGTC ATCTTTCATC 


600 


50 


TTAAATGCTT 


TTTTATACTT 


CGCTTTAATA 


GCACTCGGAA GCATCACTTC TAG CAT AG AA 


660 




ATACGTTTAA 


TGACATGAGT 


TGAACCCATC 


CACTCACTTA AAGCTATTAA TTCTGATGTT 


720 


55 


AATTCTGGTT 


GTATATCTTT 


CACTTCTATG ATTTTTTTTA ACTTCGAAAC GTCAAGTTGT 


780 
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20 



25 



ACAATTACAC GCACACCAGG TTGGATGACA GATTCGAGTT GTTCGGGAAT TATATAATCA 900 

AATTTATAGT CAACGCTCTT CGACGCGACA TCGACTATGA CTTTCGCTAT CATTATTGCC 960 

ACCTAGTTTC TAGTTCATCT AAAATTTGTG CAGCTAATAC TACTTTTTTT CCTTTCTTGA 1020 

TATTTACTTT TTCATTATTT TTAAAATGCA TTGTCAATTC ATTATCATCA GAACTAAATC 1080 

CGATAGACAT ATCCCCAACA TTATTTGAAA TAATCACATC TGCATTTTTC TTGCGTAATT 1140 

TTTGTTGTGC ATAATTTTCA ATATCTTCAG TCTCTGCTGC AAAGCCTATT AAATACTGTG 1200 

ATGTTTTATG TTCACCTAAA TATTTAAGAA TGTCTTTAGT ACGTTTAAAA GATACTGACA 1260 

15 AATCACCATC CTGCTTTTTC ATCTTATGTT CTAATACATC AACCGGTGTA TAGTCAGATA 1320 

CGGCTGCTGC TTTTACAACA ATATCTTGTT CGTCAAATCG GCTTGTCACT TGTTCAAACA 1380 

TTTCTTCAGC ACTTTGAACA TGAATAACTT CAATATCTTT TGGATCCTCT AGTGTTGTAG 1440 

GACCAGCAAC TAACGTCACG ATAGCTCCTC GATTTCGCAA TGCTTCAGCT ATTGCATAGC 1500 

CCATTTTTCC AGAAGAACGA TTGGATACAA ATCTGACTGG ATCGATAACT TCAATAGTTG 1560 

GTCCTGCTGT AACCAATGCG CGTTTATCTT GAAATGAACT ATTAGCTAAA CGATTACTAT 1620 

TTTGAAAATG AGCATCAATT ACAGAAACGA TTTGAAGCGG TTCTTCCATA CGTCCTTTAG 1680 

CAACATAACC ACATGCTAGA AATCCGCTTC CTGGTTCGAT AAAATGATAC CCATCTTCTT 1740 

30 TTAAAATATT AATATTTTGC TGCGTACGTT TATTTTCATA CATATGCACA TTCATAGCAG 1800 

GCGCAATAAA TTTCGGTGTC TCTGTTGCTA GCAACGTTGA TGTCACCAAA TCATCAGCAA 1860 

TACCTACACT CAATTTTGCA ATTGTATTTG CCGTTGCAGG TGCAACAATG ATTGCATCTG 1920 

CCCAATCACC TAATGCAATA TGCTGTATTT CTGAAGGATT TTCTTCTATA AAAGTATCTG 1980 

TATAAACAGC ATTTCGACTT ATTGCTTGAA ATGCTAATGG TGTCACAAAT TTTTGTGCGT 2040 

GATTSGTTAA CATAACGCGA ACTTCATACC CAGATTGTGT TAACTTACTT GTCAAATCAA 2100 

TTGCTTTATA TGCCGCAATG . CCACCTGTAA CGGCTAATAA TATTTTCTTC ATATTCAATC 2160 

TCCCTTAAAT ATCACTATGA CATTTACGCT TTACATCATC ATATGCGCAC AAATGCTCAT 2220 

TACTTTTTTA TAGATACAAA TTTAGTATTA TTATAACATC AATCATTGGA TAAACTAAAA 2280 

AAACACACCT ACATAGGTGC GTTTGATTTG GATATGCCTT GACGTATTTG ATGTACGTCT 2340 

AGCTTCACAT ATTTTTAATG GTCGAAACTA TTCTTTACCA TAATAATCAC TTGAAATAAC 2400 

50 AGGGCGAATT TTACCGTCAG CAATTTCTTC TAACGCTCTA CCAACTGGTT TAAATGAATG 2460 

ATATTCACTT AATAATTCAG TTTCAGGTTG TTCATCAATT TCACGCGCTC TTTTCGCTGC 2520 

AGTTGTTGCA ATTAAATACT TTGATTTAAT TTGTGaCGTT aATTGGTTtA AAgGTGGATT 2580 
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TTTArGTGcT CAGCTTCTAC AATACATTGA ATTCtATTCy TCGcAAGtTC TACTTCAtCA 2700 

TTAACTACAA cGTAAyCGTA TAAATTCATC ATTTCrACTT CTkTACGCGC yTCGTTAATA 2760 

CGACTTTGTA TTTTCTCATC AGATTCTGTT CCTCTACCTA CTAATCGCTC TCTCAAGTGT 2820 
TCTAAACTTG GAGGTGCTAA GAAAATAAAT AGCGCATCTG GAAATTTCTT TCTAACTTGC ' 28B0 

TTTGCACCTT CTACTTCAAT TTCTAAAAAT ACATCATGAC CTtCGTCCAT TGTATCTTTA 2940 

ACATATTGAA CTGGTGTACC ATAATAGTTG CCTACATATT CAGCATATTC TATAAATTGG 3000 

TCATCTTTGA TTAAAGCTTC AAACGCATCC CTAGTTTTAA AAAAGTAATC TACGCCATCA 3060 

15 ACTTCACCTT CACGCATTTG ACGTGTTGTC ATTGAAATAG AATACTTATA TGATGTACTT 3120 

GGATCTTCAA ATATnCGTnT TCTAACAGTA CCTTTACCTA CTCCAGATGG TCCTGATAAA 3180 

ACGATTAACA ATCCTTTTTC ATTATCCATG CCTTACGACC TCTCTAAGCT AATCTTCTAT 3240 

TATTTAAATA TGATATCACA TTGTTCTTTA TATTGTATAG CATATTTGAA ATTGCATGCC 3300 

ATAATTTCTA TTAAGTCTAA CAATATCGTT ATATTGCACG ATTAATTTTA ATTAAATAAA 3360 

TTGAATTGCA AACTTTTAGA TAATGTAAAA TGTATGGCAT AATGTATGGT TCAATAACTA 3420 

TACTGAAAAG TTACAATCAT GTTAAAATGA AACGAATGAT ATGAAGAAGG TGGAAGATAA 34 80 

ATTATGGCTT ATGATGGCTT ATTTACAAAG AAAATGGTTG AGTCTCTACA ATTTTTAACA 354 0 

ACAGGACGTG TTCACAAAAT CAATCAACCT GATAATGACA CGATACTAAT GGTTGTACGT 3600 

CAAAATAGAC AAAACCATCA ATTGTTATTG TCAATCCATC CAAACTTTTC AAGATTACAA 3660 

TTGACTACTA AAAAATATGA TAATCCATTT AATCCACCCA TGTTTGCGCG TGTTTTTAGA 3720 

3 $ AAACACTTAG AAGGTGGTAT TATCGAATCG ATTAAGCAAA TTGGTAATGA TCGTCGCATT 3780 

GAAATCGATA TAAAGAGTAA AGATGAAATT GGCGATACTA TTTACCGCAC TGTCATCCTT 3840 

GAGATTATGG GTAAACATAG TAACTTAATT TTAGTAGATG AAAATCGCAA AATAATTGAA 3900 

GGATTTAAAC ACTTAACACC AAATACGAAT CACTATCGTA CAGTAATGCC AGGATTTAAT 3 960 

TATGAAGCAC CACCTACTCA GCACAAAATA AATCCGTATG ATATTACAGG TGCAGAGGTG 4 02 0 

TTGAAATATA TCGATTTTAA CGCAGGTAAT ATTGCTAAAC AATTATTGAA TCAGTTTGAA 4080 

GGATTTAGCC CTTTAATTAC GAATGAAATC GTTAGTCGTC GTCAATTTAT GACTTCATCA 4140 

ACATTACCAG AAGCATTTGA CGAAGTAATG GCAGAAACCA AGTTACCACC TACTCCTATT 4200 

50 TTTCATAAAA ATCATGAAAC AGGTAAAGAG GATTTCTATT TTATAAAGTT AAATCAATTT 4260 

AATGATGATA CAGTTACATA CGATTCATTA AATGATTTGC TTGATCGTTT TTATGATGCG 4320 

CGTGGCGAAC GTGAACGCGT TAAACAACGT GCGAATGATT TAGTTCGATT TGTTCAACAG 4380 
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ATAAAGATAC TGAACAGTTA TATGGTGAAT TGATCACTGC TAATATATAT CGAATTAAGC 4500 

AAGGCGATAA AGAAGTGACG GCATTGAATT ATTATACGAA TGAAGAAGTT GTCATTCCTT 4560 

5 

TAAATCCTAC AAAATCCCCA TCAGCAAATG CTCAATATTA TTATAAACAA TATAAyCGTA 4 620 

TGAAAACGAG AGAmCGTGAA TTACAACATC AAATTCAATT GACGAAAGAC AATATAGATT 4680 

10 ATTTTTCAAC AATCGAACAA CAATTACATC ATATTTCTGT CCATGACATT GATGAAATTA 4740 

GAGATGAATT AGCAGAACAA GGCTTTATGA AACAGCGTAA AAATCAAACT AAGAAAAAGA 4800 

AAGCGCAGAT TCAATTACAA CATTATGTAT CAACTGATGG CGACGATATA TATGTTGGTA 4 860 

15 AGAATAACAA GCAAAATGAT TATTTAACAA ATAAAAAAGC TAAAAAAACT CACACATGGT 4920 

tACACACAAA AGATATTCCT GGTTCACATG TCGTTATATT TAATGATGCA CCAAGTGATA 4 980 

CGACAATCAA GGAAGCGGCT ATGTTAGCAG GATACTTTTC AAAAGCTGGT AATTCTGGAC 504 0 

20 

AAATACCTGT TGATTATACA TTAATTAAAA ATGTGCATAA ACCATCaGGT GCAAAGCCTG 5100 

GGTTTGTAAC ATATGACAAT CAAAAAACTT TGTATGC 5137 
(2) INFORMATION FOR SEQ ID NO: 218: 

25 

. (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2267 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
30 (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 218: 



40 



45 



50 



GTTTTATCGC 


AGCAGTAAAG 


CTATCAATCG 


GCGGTTCAAT 


TGATGATGCA 


TTAGCAGAAA 


60 


TCAnACAATC 


ATTTTAGTTA 


AAATTTACTA 


ATAATGAaAA ATGTAAACCT 


TTTTCAAATG 


120 


AAACTTTATa 


AaAAATATGA 


TAGTATATAT 


GTAAATGTTT 


AATAAAATCT 


GGAGAAATAG 


180 


GAGGACATTG 


CCATGCAACA 


CCTTATAAAA 


AAACATGTAT 


TGAATGGCGA 


GTTTGATTTA 


240 


GTACGACAAT 


TGATGTCCGA 


AACAGATTTT 


ATGGAATTTG 


AAGAAGCATA 


TATTTCAAGT 


300 


GCGCATGAAG 


TAGAAAGTAT 


GATGTTTTAT 


ACATGTATTT 


TAGATATGAT 


TAAGTACGAA 


360 


GAATCATCTG 


AAATGCATGA 


CTTAGCATTT 


TTATTGCTTG 


TGTATCCACT 


AAGTGAATAT 


420 


GAAGGTGCTT 


TGGATTCTGC 


TTATTATCAT 


GCAGACGCTT 


CCATAAAACT 


TACTGACGGC 


480 


AAAGAAGTTA 


AAAGTTTGTT 


ACAAATGTTA 


TTATTGCATG 


CGATACCAAC 


ACCTGTTATT 


540 


TCAGATAAGA 


AGGCTTTTGA 


TATCGCCAAG 


CAAATTTTAA AATTAGATCC 


TAATAATAAT 


600 


GTTGCTCGTA 


ACGTCTTAAA AGACACTGCC 


AAACGTATGC gACAaCGTTG TTGTTGATAT 


660 
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AGTTTTAACA TTTGGTTGGG TTGGGCATAT GTTCCAGCCT TTTTTAATAC TTAAAAACTA 780 

ACGAAgTATA CTTGTGTGCA CAAATGGTTT TTATACAACA TTTTATAAAT TTATACATTT 840 

5 

TAATAAAGAA CATACGATAG ATGGTTTAAA CCTTGTTAAC TGAGAAATTT TGATATGTAT 900 

TCTTCGAAAT TTAACTAAAT ATACGAAATT CAAGAAGCAC AATAATTAAT CATTTTTCCT 960 

1Q ATACAAAAGT TCGTATGACT GCATTATAAA AGCATAAATT TATAATTTTT TTAAATGTCA 1020 

TTGAACGTGA TAATGTGAAT GGATTGAGCA ATTTTGAAAA AGTGAAAAAT AACCTATGCG 1080 

ACTTGCAATT AATTTTCAGT ACGTTATAAT GCACACTGTG CAAAATTAAG GAGGTCTATT 1140 

1S ATTCACATGA TGATGAaTAA AGAAGCAACA AAAATTGGAT TTGCCTACGT CGGCATTGTA 1200 

GTGGGCGCAG gATTTTCAAC TGGACAAGAA GTTATGCAAT TTTTCACTAA ATATGGCTTG 1260 

TGGGCTTATT TAGGTGTTAT TATATCTGGT TTTATTTTAG CTTTTATTGG GCGCCAAGTA 1320 

20 

GCAAAAATTG GTACTGCCTT TGAAGCGACA AATCATGAAT CAACATTACA ATACGTATTC 1380 

GGTGAAAAGT TTAGTAAAGT CTTTGaTTAT ATTTTAATCT TCTTCTTATT TGGTATAGCT 144 0 

GTAACCATGC tAGCTGGTGC AGGCGCAACA TTTGAAGAAA GTTATAACAT ACCTACATGG 1500 

25 

CTAGGTGCTT TaATTATGaC ATTAGCGATT TATATTACGT TGCkATTAGA CTTTAATAAA 1560 

ATAGTACGTG CACTAGGTAT CGTTACACCA TTTTTAATTG TTTTAGTTGT ATTAATCGCT 1620 

30 GGCGTTTATT tATTTAAAGG TCATGtTTCA TTAGCAGAAG TTAACCAAGT AGTGCCtGAA 1680 

GCAAGTATTT GGAAGGGAAT CTGGTTTGGT ACAATATATG GTGGATTAGC TTTTTCTGTA 1740 

GGTTTTAGTA CCATCGTAGC AATCnGTGGG GATACTGAAA AGCGTACAGT GTCAGGTGCA 1800 

35 GGCGCGATGT ATGGTGGTAT TATCTATACT GTATTACTAG CATTGATCAA CTTTGcATTG 1860 

CAAGTGaATA TCCAACTATT AAAAATGCCT CAATTCCTAC ATTGACGTTA GCAAATAATA 1920 

TCCATCCTTT AATAGCAACA GTGkTATCTG TTATTATGCT GGCGGkTATG TATAATACTA 1980 

40 

TTCTAGGACT AATGTATTCA TTTGCAGCAC GTTTTACAGA ACCATACAGT AAAAATTATC 204 0 

ATATCTTTAT TATTATAATG ATGGTAGCAG GTTATTTATT AAGTTnCGTA GGATTTGCTG 2100 

AATTAATTAA TAAGTTATAT ACnATTTATG GGATATGTAG GCTTATTnTA TTGTAGTAGC 2160 

45 

TGTAATTATn AAATATTTCC AAACGTAAAA ATGGCGGATA AAAAACATAT TGCTTTAATA 2220 

TCATATGGAG GGG ATATCCG AAACTTTACA ATTTGAATCA CTTTGGT 2267 
SO (2) INFORMATION FOR SEQ ID NO: 219: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6336 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
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(Xi) SEQUENCE DESCRIPTION: ! 

5 

GTCAATGTAA CCTAATAGTT TATGTCTATC 
AATTTCCATA ATTTCAGCTG ATGAAGTTTG 
ATCAGGATTT TGTCTTATTG CACGTCTAAT 

10 

CGTTACTGTA CAAGTATTAA TAACAAATAC 
ATAGTTTGCT TCTTTAAATA ATTGCCAGAT 

15 ACCTAATGTG TGaACGCAAC TGTTGACATA 
CTTATTGCAC TTAACGCATA CAATGGCGCA 
. CCAACAACTG TACTAGTATT ACTAAATAAT 

20 GGaCCAAAAA TCATCAACAC TTTATCCTGA 
TTGCTTAACT CACCATCTTT TGCTTCCTCT 
TCAATAGTAT CACAAATTAA TTTTAAATTC 

25 

CGATAGCTTT GTTCAGCAGC TTCTTTAATT 
ACTTTTGCCT CGTTTAATTT AACAATTGAA 
GCACCCAATT CAGTAGCTTT TTGTAGCAAC 

30 

CTGCAAATCG TAACATCAAC TGGCAATTCT 
ACTTCAATTT TATCACTTGT TATGTCAGCA 
35 AAAGTTAAAA TAATTTTACT ACCAACATCA 
TCTTCTTTTT TTGTAATAAA AAAACGCTGA 

ACGTJGCACA TTATTCACTC ACTTTCTGGC 

t 

40 

GTTCTGAAAT AATTTTAAAA CCTACACGCT 
CTTTTATAAT ACCAGAAGTA ATAAAATAAC 
CAATCATTTC ATCAATAATA TGCGCTAAAA 

45 

TTTCGTCTTT CAATAAGTTA CCTGGAACAG 
TGAAGTTTTC TTTAGCTACA CTCACTGCCA 
so TTACACCGAT TAGATGACTT GCAATACTTA 
CTGAATGCTG TGGCAATACA TATGTTTCTA 
GATCACCTGT TCCAAAAGCC ATACCTGGGT 

55 



5EQ ID NO: 219: 

TTGTGTACCA ACTACTACAT CGACACCAGG €0 

CGCATAACAA CCTGTTACAC AGATTACAGC 120 

TATTTGACGA CTTTTTTTAT CACCCGTATT 180 

ATCAGCATTC GCTTCAAAGT CAACGCGCTC 240 

TGCTTCAGTT TCATAATGGT TTACTTTACA 300 

AATATTCACC CCATTAATTC TTTTTCATAA 360 

GTTTCTGCCC GTAAAATTCT CGGCCCAAGA 420 

GAAATTTCAT TTTCTGACAA ACCACCCTCA 460 

GCATTGAATT GTTGTAAAGT TTGCTTGAAA 540 

TCATATGCAA TAAGAATATA GTCATAATTA 600 

GACTCGAATT GAATAGATGG AATCACTAAA 660 

ATTTTTTGCC AACGCTCTAT CTTTTTGGCA 720 

CGTTCCATGC TCACAGCTAT AAATGATGAA 780 

CACTCATATT TGTCAGCTTT GATTAGTCCA 840 

GTATTAATAT TTTGTTTTTC TTTTAAATCA 900 

ATTTCACATA AATAAACTGT TTGATCATTA 960 

TATCTCATTA CATTTGTTAT ATGATGAATA 1020 

CTTACATCAG CGTTTTGGnT CTATGAAATA 1080 

CAACAAGACA AACCCAACCG TTGTCATGTT 1140 

CCATATGTGA CTGTATACCT TCATACTTCT 1200 

CGCCTTCATT TAGAGTATTA TAAGCATCTT 1260 

TATTTGCTAT TACAATATCA AATTTTTCTG 1320 

CTTCAATTAA CGTTTCACAA TGATTTCTTC 1380 

TTTCATCAAT ATCCAACGCT TTAATACGTT 1440 

ATATACCTGA GCCAGTACCA ACATCAATTA 1500 

TTGCCTTCAA ACACATACTT GTAGTCGGAT 1560 

CGAGCTCAAT GCAAAGCTCT TCATCCGCTT 1620 
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GGAAATAGTT TTTCCATTCA TTTTCCCAAT CCGTCTCTGC AATAATTTGC TCACTGAATT 174 0 

GAACGTTATG TTGATCAAGT TCATCTAAAT TTAATAACTC ATCTTTAATT TGCTGTCGCA 1800 

5 

ACTTATCATC ATAAGTCATT TCATTAAAAT AGGCTTTCAA TCTTACTCCC TTATCTGGAT i860 

AATCCTCTTT TTTCAAAGCG TAAATTTCAC CGTATTTATC TTCTGGTTGG TTAATTAAAT 1920 

^ CATCTGAATC TTCTATCACG ACACCATTTG ATCCATGATT TTCAAGTATA TTGGTAGCCA 1980 

ATTCTACTGC TTCATGATTA ATAATAATTG AAAGCTCTGT CCAGTTCATA CTTTATTCTC 2040 

CCTTAAAGAA TCTTTTTGCT CTATCTTTAA AATTCGAAGG TTGTTCATTA ATTTCTTCAC 2100 

15 CATTTAATTG GGCAAATTCT TTCATTAGTT CTTTTTGTCT ATCTGTTAAT TTAGTAGGCG 2160 

TTACTACTTT AATATCAACA TATAAATCTC CGTATCCATA GCCATGAACA TTTTTTATAC 2220 

CCTTTTCTTT TAAGCGGAAT TGCTTACCTG TTTGTGTACC AGCAGGGATT GTTAACATAA 2280 

on .. 

CTTCATTATT TAATGTTGGT ATTTTTATTT CATCGCCTAA AGCTGCTTGT GGGAAGCTAA 2340 

CATTTAATTT GTAATAAATA TCATCACCAT CACGTTTAAA TGTTTCAGAT GGTTTAACTC 2400 

TAAATACTAC GTATAAATCA CCAGCAGGTC CTCCATTCAC GCCTGGAGAG CCTTCACCAG 2460 

25 

CTAATCTAAT TTGTTGTTCA TTGTCGACAC CTTCAGGTAC TTTCACTTCT AATTTAACTG 2520 

TTTTATTTTC AGTACCTTTT CCGTGACATG TTGGACAAGC TTCTTCAAAT TCTTGACCAC 2580 

3Q TTCCATTACA TTTAGGACAA ACTTGTTCAG TACGAACTCT ACCTAAAATT GTGTTTTGTT 2640 

CTACAGCTAC ATGACCAGCG CCATTACAGT AACTACAAGT CTTTTTACTT GTTCCAGGCT 2700 

TTGCACCATC ACCATGACAT GTTTCGCATG TTACATCTTT ACGGATTGAA ATTTCTTTTG 2760 

35 TTGTACCAAA TACCGCTTCT TCAAATGTTA ATGTCATTGT ATACTGAAGA TCATCACCTT 2820 

TTTGCGGTGC ATTTGGATCT CTTTGTCTGC CGCCACCGAA GAAAGAGCTA AAGATATCTT 2880 

CAAA5CCGCC GCCACCGAAG CCACTAAAAC CGCCAAAGTC AGAGCCATTG AATCCTTGTC 294 0 
40 " 

CACCAAAACC TTGTGGACCA TCATGTCCAA ATTGATCATA GcTTGCGCGT TTATTATCAT 3000 

CACTTAAAAC TTCATAGGCT TCAGAAATTT CTTTAAACTT TTCATCTGCA CCTTCTTCTT 3060 

TGTTAATATC TGGATGATAT TTTTTCGAAA GCTTTCGATA CGCTTTTTTG ATTTCATCTT 3120 

45 

TTGAAGCATC CTTACTAATG CCTAAAACTT CATAATAATC TCTTTTGGCC ACAGCTATCT 3180 

CTCCTTTTCT TAATTAACTC ATATAGTTTA ACGTAATATG TCATACTATC CAAATAAAAA 3240 

SO GCCAAAGCCA ATGTTCTATT GACTTTGACT TTTCAGATCA TGACAACATT CTAATTGTAT 3300 

TGTTTAATTA TTTTTTGTCG TCGTCTTTTA CTTCTTTAAA TTCAGCATCT TCTACAGTAC 3360 

TATCATTGTT TTGACCAGCA TTAGCACCTT GTGCTTGTTG TTGCTGTTGA GCCGCTTGCT 3420 
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TATCTTCTAT ATCTTGACCT TCTAAAGCAG TTTTAAGAGC GTCTTTTTTC TCTTCAGCAG 3540 

ATTTTTTATC TTCTTCACCG ATATTTTCGC CTAAATCAGT TAAAGTTTTT. TCAACTTGGA 3600 

5 

ATACTAGACT GTCAGCTTCG TTTCTTAAGT CTACTTCTTC ACGACGTTTT TTATCTGCTT 3660 

CAGCGTTAAC TTCAGCATCT TTT AC CAT AC GGTCGATTTC TTCGTCTGAT AATGAAGAAC 3720 

w TTGATTGAAT TGTAATTCTT TGTTCTTTAT TTGTACCTAA GTCTTTTGCA GTTACATTTA 3780 

CAATACCGTT TTTATCGATA TCAAACGTTA CTTCAATTTG AGGTTTACCA CGTTCAGCTG 3840 

GTGGAATATC AGTCAATTGG AATCTACCAA GTGTTTTATT ATCCGCAGCC ATTGGACGTT 3 900 

15 CACCTTGTAA TACGTGTACA TCTACTGATG GTTGATTATC TACTGCTGTT GAATAGATTT 3 960 

GAGATTTAGA TGTAGGAATC GTAGTGTTAC GTTCAATTAA CGTATTCATA CGTCCACCTA 4020 

AAATTTCAAT ACCTAAAGAT AGTGGTGTTA CGTCTAATAA TACTACGTCT TTAACGTCAC 4080 

20 

CTGTGATAAC GCCACCTTGG ATTGCAGCTC CCATTGCCAC TACTTCGTCC GGGTTTACTC 4140 

CTTTGTTAGG CTCTTTACCG ATTTCTTTTT TGACAGCTTC TTGTACTGCT GGAATACGAG 4200 

TTGATCCACC AACTAAGATA ACTTCATCGA TATCTGAGTT TGTTAAGCCA GCGTCTTTCA 4260 

25 

TTGCTTGGCG TGTAGGTTCC ATTGTTCTTC TAATTAATGA ATCTGATAAT TCTTCAAATT 4320 

TAGAACGAGT TAAGTTTACT TCTAAGTGTA ATGGACCGTT TTCACCAGCT GAGATAAATG 4380 

30 GTAATGAGAT TTGAGTTTGT GATACACCTG ATAAGTCTTT TTTAGCTTTT TCAGCAGCAT 4440 

C TTT C AAA CG TTGTAATGCC ATTTTATCTT GAGATAAGTC TACGCCATTT TCTTTTTTGA 4500 

ATTCTGCAAC TAGGTAGTCA ATAATTACTT GGTCAAAATC ATCACCGCCA AGTTTGTTGT 4560 

35 CACCGGCTGT TGATAGTACT TCGAATACAC CGTCACCTAA TTCTAGGATA GATACGTCAA 4 620 

ATGTACCGCC ACCTAAGTCA AAAACAAGAA CTTTTTCATC TTTATCAGTT TTGTCTAAAC 4680 

CATA7GCTAA TGCTGCAGCT GTTGGTTCAT TAATGATACG CTCAACTTCT AAACCAGCAA 474 0 

40 

TTTTACCAGC ATCTTTAGTT GCTTGACGTT CAGCATCGTT AAAGTATGCA GGTACTGTAA 4800 

TTACAGCTTT GTCAACTTTC TCACCTAAaA TAgTTTCAGC TGTATTTTTT AAGTTTTGTA 4860 

AAATCATAGC TGAGATTTCT TGTGGTGTGT ATGATTTACC TTCAATATCT ACTTTATAAT 4920 

45 

CAGTACCCAT ATGACGTTTA ATAGATTGAA CAGTGTTTGG GTTTGTAATA GCTTGACGTT 4980 

TTGCTACTTC aCCAACTTGA GTTTCTCCAT TTTTGAAAGC TACAACAGAT GGTGTTGTAC 504 0 

50 GTGAACcTTC AGGGTTTTGA ATTACTTTTG GCTCATCGCC TTCTAATAcT GTnACACATG 5100 

AATTTGTTGT ACCTAAGTCT ATACCAATAA TTTTACTCAT AATAAAATTC CTCCATTTAA 5160 

TCATTAAATT AATTTAATTT TAAACAATGT CTTTTCGCCA AATTTAAGTT ATTGGTTTAC 5220 

55 
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AGTGATTTCG 


CCAGATTCAA 


AATCAGGGTT 


ATCATCTTGA ACTACAGCTT 


GGTGAATATT 


TGGATCAAAT 


GCTTCACCTT 


CAGTTTTAAT 


AACTTCAAGA 


CCATTATCTT 


TTAGTGCGTT 


AATCAAACTT 


TCATGCACCA 


TTTGTACACC 


1 1 xnGAAGA 


GATTTAAAAG 


TCTCATCATC 


ACCTTCAATT 


TGAAGTGCAC 


GTTCTATATT 


GTCTATTGCT 


GGTAAAATAT 


CTGTTAACAC 


ACGTTGTGCT 


TGATATGTTT 


TGTTTATTTC 


ATTTTCTTTT 


TGAATTCTAC 


GCTTATAATT 


TTCAAACTCA 


GCGTAGAGCC 


TTAAATATTT 


CTC1TCGTTT 


TCATCTGCTA 


ATTGTTGAAG 


TTCATTAATT 


TTTTGATCTT 


TTGGATCTAT 


TTCTTCAATA 


ACATTCTCGT 


CAGACGTTTC 


TTCTATTGCT 


TCATCTTGTA 


AATGACCTTT 


ACTTTCTTCA 


GCTTGTTCAA 


CTGAATCATC 


AATATTTTGT 


TTGACGTTTG 


TTTCTTCAAC 


TGTTGATTCA 


GTGTTTTTTT 


CAACTGATTC 


GTCTTTATTT 


GTCATTTTCT 


GTCCTCCAAT 


ACTTTCTAAT 


CCATCATTAC 


CAAATTCTAT 


TTAATAATTG 


AATGACATTT 


TGATAATGCA 


TAGCTGTAGG 


TCCAATCACA 


GCGATTTGAC 


CTTTTAACGT 


TTCATCAAAA 


TGATATTGAC 


TTGTTACAAT 


TGAAATATCA 


CTTAAGCTGT 


CATCAATTTC 


ATTACCAATT 


TTTACATTAA 


TATTTGGTGA AGATATATCT 


TGTAATAATT 


CTGCAATTCT 


ATTTGATTCT 


ATATATTGTA 


GAATGGGCTG 


AATTGAAGAT 


ACATTACTTT 


CATTCAATGC 


ATCAATAAGT 


TTAACCTTTC 


CACCCATATA 


AATGCTATTA 


CTTTGATTAG 


AAATATGATT 


ATTCATCGTA 


TTTAACAATT 


TATTGATAAA AATTTCTTCC 


TGCTCTGATT 


GAaCAAAAGA 


GACAATATCA 


TCTTGTAAAT 


TCTGATTAAA 


CTCAGTTAGT 


TTGTTTGTAA 


CAAAATTTGA 


TATTGTATTT 


AGTTTGTCAT 


TATTAA 







(2) INFORMATION FOR SEQ ID NO: 220: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 13059 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 220: 
TTCATGATTA TTATCTGTTG TAGACACTGC TGGATCTTCC GATGTATCTT TCGATGCATC 
TTTCGATTTG TGTATTTGCT GATTCAAATG GTCTAGGTCT TCTAACGCCT TATTTACCAT 
TGCTTCATCA TTTTTATCAT CTTTTTCTCC ATGTTTTGTT GTAGCCGTTT GTGACATATC 
ATTTTTCATT GCATTAAGAT CGTCCTCGCC ACTTTGTTGA CCCCTATCAA CATTTGAAGA 
AACCTCATTT AAATCTTTAA GCAATTGATC TAATTTACTG TCTATATCAC TTTGACCGTT 
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TTCATCTATT TGCGATGCTG TTTTCGCTTC 
TGAAGCCGAT AACTGTTTTA ATTGCTCAAT 

5 

TAAATCTTGC TTAGATAATA TCTCTTTTGT 
GGCATCGTAC GGCAAGATAT TCGTTAAAAT 

W TAACTTTACA TATAATTGAA ACGGTTTCCC 
TCACTTACTT CCTTCAAAGA ATTACATACT 
TTATCTATCT AGTTATTGTT GTTAGTAATT 

15 AAACAAAACA AGCATGACGT AATATCATAT 
AATCTTTTAT ATTAAATGAT GTTTTATTTT 
CCTGTTTAAA AACTTGCTCG AATTGTTCAC 

20 

CTAATAAAGC ATCTCGAAAC TGTTGTTGAT 
GGTCTTTACT TTCCATTGTT ATCTCATCAT 

25 CTTTAGCATG GTGTGCGGTT TGACGATAAC 
GTTCCACCGC ATTTAAAATT TCATTACCCT 
GGTATAGTTC ATTTACCCTG TCAATATTAA 

30 GATCAAGTTG CATTAGCTTA TCAGACATCT 
CTGGTAAAGt TyCAACCAAT ACCTTGATGT 
AATTTCTTTA GTATATCTAT TACGACTACG 

35 ACGAGATTGA ACCTTTGCGT CTGCTATATT 
AATAATAATA TTACAATGTC GTTTCATATC 

GACATTACCA TTACAGTGTT CTTGCCATAC 

40 1 

ATATAACACT GAAAATGGTA GGGCTAGTGA 
AAGTTGCTTG ATAAAAAATA ATGCGAATGC 

45 TTGCCAATCC AATATGACAT CAGATGTTAC 
TGCTGTCATA TATTTCTTCA AGATCGCTTT 
TTTAATACCA TTCTTAGAAT AATAATCGAC 

50 TTCGACACGA CTAACAATTC TAGGGCGCTC 
ACGTCCCATA TCATTaATTG TAGCCGAATT 
TACAGTAACC TGATTAAAAA ATCGTGGTTT 

55 



ATTTAGTTGT GCTTTATAAT GTTCTTTAGA 420 

TTGACGAATT GCCTTGTCAA CTTTGTCTAA 480 

AATTTCAGTA TCCTTTTCAG ATGCAGCTTG 540 

GATACTTGTC GCCATCATTG TCGAACACGA 600 

TCGATATTTA GCCATCAACA TACTCCTTCC 660 

ATTATATACC TGTTTACAAG AAATTTACAC 720 

ATCTACTTAT TACTTAGCTT ATATTTAAGT 780 

TGTCCATGTC GCTAACATCA TATTACGTCA 840 

AGACTGCTTT TTCCTTTTAG CTTTCGAGCG 900 

GCGAGATTTC GTGTGCATGT GCTTTTTGTG 960 

CTTTCAAACT TTCTAACATT TGTATTAATT 1020 

TATGCTCAAA TAAGTGCTCT GATAATGTTA 1080 

CTAAAATCAA CAACTCATAG TCAAACGCTT 1140 

CATTGATATC AAGATAAATA TCACATAACT 1200 

TAGATGGGTA TAAATGCACA TTAGCATATT 1260 

CTGTAATAGC AGCGATGTGn AACTTAAAAT 1320 

TACGAatTGa TCCgAGTTAG TTAATATTAC 1380 

ATAGTTATAT AGATATCCGC CTTGTAAAAT 1440 

GAGCATCGTT TCATATTCGT TTTTATCTGG 1500 

ACCTTTACAC ATCAATTGCA TATTTCCCGG 1560 

CAAAACATCA CTACCTTTTG ATGGCAAATT 1620 

GTTAATAACG AAATGATGTT CCGTAATTTC 1680 

GAGCTTTGAA GGGAAAAAGT AAGACTTCCC 174 0 

AAAATTTTCA TAAATCACTT CTTTACCTTC 1800 

ACGATTTAAA TCGTAAACAG TTTGTGCAAA 1860 

AAATCGGACA CGTTGTTGGT CATCAAACCA 1920 

TCCACTTTGA yAAAATATTT TACCTCGyAG 1980 

GTTGTTACCT TTAATTTCCC AAAAAGCTGG 2040 

CATATTTTCT GTATTATGAT TATCTGCAAA 2100 
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20 



25 



TAAATCTTCT TCCAACTTAC TGGCTTTAAA AGACTCATAT AACTTTCGTG AATGATCGTT 2220 

AAAGTAATCA AATAATTTAA TCATGTAGCA CCTCTTGaAC TAATGTTTCC CATTTTAAAA 2280 

TAATATCTTG AGTCATAAAT TGCTGTGCCA CTTCATAAGA GATGTCATGT GGTGTCTGGG 2340 

GACCATTGTT AAAATACATT ACAATGGcAT GAGCTAGTTT TGCGATAACA TCATCCACAC 2400 

TATCTTCGTC GGTATCAAAA GGTACCAAGT AGCCATTTTC CCCATCTCGA ATAAAGGTTG 2460 

GGTTACCATA ATTCACATTT AATCCAATCA TACCTAGTCC TGAGCCTACC GCTTCCATTA 2520 

GTGTTAACCC AAAACCTTCG CTAGTTGATG CAGAAAGAAA TAACTCATAA TCATTATAAA 2580 

15 TTTCATCAAG TTTAACATGC CCTAGTAAAC GAATATAATC TTGTGCGCGG TGTGTATCAA 2640 

TAATTTTACG CAGTCGCGTC TTCTCGCTAC CTTCTCCATA AATATCAAAT GTTAATTCTG 2700 

GCACTTGTCG TTTAGCCACG ATAACCGCTT TGACAAGCCA ATCAATATGT TTCTCATTCG 2760 

CTAAACGAGA TGCACTAATC ATCGCATATG GCTTTCTTGA TAATGTTGGA TATGATAATG 2820 

CATCAATGCT TCCCACAGGA ATAGTATAAA CACGTGGGCG ATAACCTTGA TATTGCTCAA 2880 

ATTGTCGACA AACCATATGA TTTTGAATAT CTGTTGCTGT AATAAAGAAA TCAATGTATT 2940 

TAGCTTTTGA AAATTGATAT TCATAATAAT TGTTCCATAG TATATGCTGC TCACTCATCA 3000 

TATTATTACT ATAATGATCA GCATGAATCA CAACACCAAC TTTACTATCA CCTTTATGCT 3060 

30 GCAAAACAGC CTGACCAATA TCAGAAGCGC GGTCTAATAT GACAATATCG TCTCGGGTTA 3120 

AATTCAATCG TTGTAAAAAG TATGCAATAA ATTCCGTTTT GTTATACAAC ACCGCATCTT 3180 

CAAACACATA TATAGAGCTG TCTCCATCAA TATATTCGTT ATAAGCGATG GAACCATCTT 3240 

GATTATAAAA TTGTCGCATA TATAATTTCG CTTTATTATC AGCTGGTGCA TAATACTCAG 3300 

AAAATATGCG CGTATAACTA TAAAAATCTT TACGTACTAA CATACTATTA ATTACAAATT 3360 

CTGCACGATC CACAATATCT TTTTGTTCAT TTTGCAGATA ACATGTTACA AATGATGATT 3420 

TCCCATTAAA ATATAGGCGG ACTATCTTAC CATTTCTTTC TCTAAAACTA ATGTCATGAC 34 80 

CAAGCTCACG TTCAATGTCA TCTAACGTGT ACGTTGTTGG TGCTAAAGAA ATATCACTAA 3540 

AATACTGATA CAACCAAATA ACTTCTTGAT CTTTAAACCC AATGTTTTGC GTTAATGTCT 3600 

GTATGTTCTC TGACTGTATA AAATCTAAAA ACACAAATTT AGTGTCTTGA TTTGTACGTC 3660 

TCAATAATTT AGCACGGTAA GCTTGTGCAT ATTCAACACC GCTACTCGCC CAGCCTATAC 3720 

50 CAAAGTTTAT ATTATATATT GTCATGCGCT ACCCCTTTTC ATTTATGGAA AATGTATAAC 3780 

TGGCATACCC TCTTTATCAA ATGTAATCAT GCTTTGACAA ATATTTTTCA CCATTCTTTT 3840 

TTTGATATTT CGTGTCATAA CTTCAAATGA ATCTAAGGCA ACTCTATGGT ATTCAAAAAT 3900 

55 



35 



40 



45 
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75 



20 



25 



GACTTGTTCT AACCAACATG AATCAATTGC TTTCAAAAAG ACTTTTTGAA CGAAAATATT 4020 

^ ATAATAATAT GCACTTTGCA TGTTTTTACG ATTCAAAGCT AATTGCTTTT CAAATTGCTC 4080 

TAATAAAAAT GTCACTACTG CTTGCTTATC TTTAAAATTA ACACAAGCCA CATCTTTATT 4140 

AAATTGGAAA CTTAAATTTT GATAAATATA CTCGACAACA CGCGATTTTG TTAGCACCTT 4200 

10 TTCCTCATTT ACAAACATTT CAAATACATC TTTAGCTAAC GCTTTAAAAT CTTGATTCTC 4260 

AGCATCATCT ATTTCTAAAA CTCGATTGCG TTCCTCGTAT ACAAGATCTC GCTGTATACT 4320 

AATGCTTTTT TCAAATTCAT TAGCCATTTC ACGAGCTTTA ACCCCTTGTT CTTCCGAGAt 4380 

aCGcTGCGCT TTAACTACAA TTTGCTTAAC TTTGCGATTA AACAAATTAC TTTGCGATAA 444 0 

TCGTTGTGCA TCTAATGAAT ATAATTGATT ATTTTCCGCT AAATTACTAT CGCTCCATCG 4500 

CTTAACTAAA TAATCATCTA GTGAAATATA TATACAAGAT GATCCCGGAT CCCCTTGTCT 4560 

ACCAGAACGA CCACGTAATT GCCTGTCTAC ACGGCTATTT TCCATATGTT CATGAATAAT 4620 

AACAGCTAAT CCACCTAATG CTTCGACACC TTCACCAAGT TTAATATCTG TGCCTCGACC 4680 

TGCCATACTA GTCGCAACAG TCATGGAACC AATTTGCCCT GCTTCAGCTA TCATCTGCGC 474 0 

TTCTTTTGCA ACATTTTGCG CAATGAGTAA ATTATTAGGA ATATCCATTT GGAATAATAC 4 800 

TTTCGAAAAG TATTCAGCCG CTTCAGCAGT TCTCGTTATG AGTAAAACCG GTCGCCCCGT 4 860 

30 TTCATGAAGT TCAACTATAT CATGAATCAT CGCGATGTTT TTCTCATCAA CTGAACGAAA 4 920 

CACTTTATCT GGTTCATCGA TACGTTGAAT CGCTTTATCA GTTGGTACTT GTACGACTAT 4 980 

TTTTGAATAC AAATCAAAGA ACTCTGATTC GCCTAATTTT CCTGTAGCTG TCATACCTGA 504 0 

AAATGATTCA AAAAGTTTAA ATAAATTCTG GAAGGTAATT GTTGCCATAA CACTTTTATC 5100 

TGTTGAAACC TCCATACCTT CTTTCGCTTC AATAGCTTGG TGAAGTCCAG CTTGCAACTT 5160 

AGTTCCCGGT AACATACGAC CTGTAATACG GTCAATTAAA ACAATATCAC CATTATATAC 5220 

AAAGTAATCG ACATTAGATT CAAACAAATA TTGTGCGCGC AGTGCTAAAT TAATATTACG 5280 

CACTAGGACC ATCGCTTGTT CGCTATATAA ATCTTCAACA TTAAAGTATG ATTGTGCCGC 534 0 

45 TTCAATACCT TGATTTAACA GCCATATTTC TTTTTTGGTC TTCTTCATTT TAAAATGCAC 5400 

GTCTTCAATC AATGTATCTA CAAACTCTTT CACAATATGA AATAGATTTG ATTGTAATCT 5460 

TGGTGCACCC GAAATAACTA ATGGTGTTTG AGCAGCATCT AAAATGATTG AATCCACTTC 5520 

50 ATCAATAATA CCGTAATTTA ATTGTGGTAA AAATTTCCCT TCCGCACTAT CAGCCAAATT 5580 

ATCAATTAAA TAATCAAAAC CGAGACGTCC ATTAGTTGTA TATATAATAT CATGTTCATA 564 0 

TATATTACGT TTTTCCCCTT TTTGATACTC ATAATCCACA ATATCAACAA AACCTAATGA 5700 
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TAATCATTCG TTGTAATTAA ATATGTTCCT TTTCCCGAAA GAGCATTTAA ATATAAAGGC 5820 

ATCGTTGCCG TTAATGTTTT ACCTTCGCCT GTTTGCATCT CCGCAATGTT ACCTTCATGC 5880 

AATACAATCG CTCCGATTAA CTGAACTTCT TTAGGATACA TACCTAATAC TCTCCAGCTC 5940 

GCTTCACGTG CCACTGCATA AGCTTCAGGT AACAATGTAT CTAGTGTATC AACTCCTGAT 6000 

GCTAAACGTT CTTTAAATTC TATTGTCTTT TGTTTTAACG CATCATCAGA ATATGATTTA 6060 

ACTTCATCGC TCCATGTATT GaTGsGTTcA CTATTTTTCT AATCGACTTT AGTCTTAATT 6120 

CGTTTATCGT AACATCTAGT TTATGTTTCA TTTACTTCCC CACCATTCAG TTTCGATACA 6180 

15 TCTAAGTAAT CTAAAAATCG TACTGGATTC ATTAAACGTG ACATATAATT TAGATGTTTG 6240 

TCTTGCTCTT CTTTAAAATA AACCTCGACA TTTGTATCTT TTAGTTCATG ATTTCCTGGG 6300 

ACATGTTCTG TAAGCCATCC TTTTAAATCA TCATCTTCAT GGCTTGTACG ATACACTTTG 6360 

20 CAACCCAAAT GCTGAGCGAC ATAAGTTGCA AAAACATTTG ACTTTGACCC ATAACTAATC 6420 

AAATTAATAG CCTTTAGGGT ATCTTGACTT TGCAAATCAT TCTTTAGTTG CTTAATATTT 64 80 

CCCTCGATAT TGTCGTCCAT CCAACGTTCA ACGAGCCAAA CATGACCAAA CAGTTTCAAA 6540 

AAATCATTCG AAATAGTTGG ATAGGTGTCA GATGGTTCTG CAATAATGAC ATTGATCATA 6600 

TCATTTCCAT ATTGGTCATC GCCTATCTTC GTCACCCGCA TGCTTTTATA CTCTAAATCA 6660 

TATTGATGCG TCATCTCTGT GATTGTTAAA CATCTAAATA TAAGACTCGT CGATGCTGCA 6720 

TTCATCATTT TTATTTTATA AGCATAGGCk TCATCAGGAT ATTGAATCGT AATACTATTT 6780 

GACTTTACAA TCTCAGTACT TAGTTTTGTG CCATTTTTAT TATAAAAAAT GATGATAAAA 6840 

TACACTGAAC CAGCAGGCGT TGCATCAAAA TCAAAATGCA ATTTATAATG CTGTCCTCTA 6900 

CGCAAAATTG GkAAACTTGG CGcACTTTTA TATTTTGAAA ATTGCTTTAA CATCAACCAC 6960 

TCATGAATCG GTAATCCAGA GGG CATCAAA GGATTTATAA AAGTCACTTC ACCATTTGAA 7020 

40 AATGATACTT TAGAGCCATA CATAAATGTA GTTTGTGAAA TATAATTCCA AGTAACTTTA 7080 

AATGTTTTGT TTTTCAGCAT GTTGAACTCT CCCAAACTTG TCTTCCAAAA TAATGTTGTA 714 0 

AAAATTAACA AACCAACTTG CAATGGTAGG TGAATCATCA TTATGTCGCC CAGGAATACT 7200 

GCGATTCATC ACTCTTGCTT GGTGTGCTGT CAATACAGGT AATAGCTCTT GAAATGCATG 7260 

TGGATCATAA TCATCATGTT GCATATATGC TATGGCAAAA ACAGTTTGTG ACAATGATTy 7320 

CTTTTGAAAT GTTTGCCAAA ATTTTTGATT TAATGCCTGT ATCGACGCTT GAGATGTATC 73 80 

ACCTTCATTA GACACCAGGA CGTCTAATGC TGTACCGAAC TCTTCTGGTC TAAGTAATCG 744 0 

CATATGTTCA GCAATCGTTC CAATATTAAC AAGTGGTTTA CCAACAATAA TTGCCTGAGG 7500 
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TAATTCATGT GATTTAAAAT TCAGCTTTTC 
TTGTTCATAT TCAGATGAAC CGATATAAAA 
5 AAGTAAAAAC GGTGCATTCA TACGTTTCAT 

TCGATAACCA CTAAAATATA CGTTTAGTGG 
AATAAATTCC TGTCGTTGAC TATCTACGAA 

10 

GTCTAATCTA GACCATCGTT TGTGTATAGG 
CTTAACAGTT ACACTTATAT AAGCATCAAA 

15 TAACATATCA TCAGTCAATA CGATTTGTTC 

CAATCTAAAT GTATATTGCA ACTCGACCGC 
AATGACTTTA TCTTTATCGT AAACGAGATT 

20 TTTCCCAAAT TCTCCACTCA ATGTGAGCTC 

AAAATTCGGA TGCACAAGTG CTAACTTAGG 

GCTAACTGCC TCTAATTTAT TATTACGTTC 

25 

AACGTATTTT TGGACATTTT CGTCTTGTTC 

ATACGTATTG TATGGTTCGC TTATCATTTG 

TGCTTGAATA TAGATAAAAT CAAAGCGCCC 

30 

TACATAACCA CTATCAAATT CAAACAATCC 
TTTGTGTTGA AAAATAGGTT CTAAATCGTC 

35 TGGCATCATT TTCACCTTCT ATTAACTCAT 

ATGCATCTAT TAATTTTAAA GAATAGGCGT 
AATAATAATT TAACGCATCA TCTAATTCAT 

40 AATCAGAGAC GTAATCTGTT TGTTGACCAT 

TAATTTGTAA ATACAAGTCA GGTTCTTTTG 
ATGCTTCTAC AACATCATGT TCAGCATGTA 

45 

CTTCAGGTGT CATTAATGCT GAAACATTAA 
CATTTACCGA CGTAATACAT TCACGAAGCC 
ATAAAATTAA ACGGTAATAA TCTTCCTGTG 

50 

GTTGCAAATC AGCGTCACTC ATACCATCTA 
GACTACTTAT ATTAGGTGAT TGTCTCGTTT 

55 



TAATGTCTCG TCAATAACAT TGATAATACC 7620 

ACTACCACCT TCAACACGAG GATCGCCGAT 7680 

CATATAATAT CCTTCGAAAC CTTCCGCTGT 7740 

CGGTTTCATA TCACCAGGGT GGAAATAATA 7800 

ACGACTACCA CCAAGTAAAA ATTGACCCAT 7860 

TCCTAAATGT ACCGTCCCGT TCCCACGCGC 7920 

TGGTTTCGCA GGTATCTCTA AAGGACTGTC 7980 

AATTAATGCA CCATCAGCGC CAGTCTGAAT 8040 

ACCATCAATA TCAAATTCTG GCCATATTTG 8100 

ATTTTGCCAA GATGCGATAG GTTTAAATTC 8160 

TGAATTACCT TGGTAAACGA CATCTCCTTT 8220 

AGAAACCTTA TCTCCATACT GTCCTGAGAA 8280 

TTCAATATTC CGGTAATGTA ATGGTTGAAC 8340 

ATATTCAACT GACCAAAATG ATTCATCAAC 84 00 

TAATAAATTC GTTAATGTCT CCGAGTATGG 8460 

TTCTGCTTCA ACAATCGCTT CAATAGCCTC 8520 

AATATCGAAG TAATCCCAAC TCACACCTTT 8580 

TCCTCCAATT TGCAAAACTC TAAATTTACG 8640 

CGAGCTGATT AATAATATTC TTAGAAGCAT 8700 

ACGCATAATT CCAATTTTTC AAATAAAATA 8760 

CAACTGTATT TATAATACGG CCATTGTCAT 8820 

TAATTTGTGG AATCCCAGCG CTAATTGCAC 88 80 

ACATATCTAT CACAAGTCGC AACGTCCGCA 8940 

TCGTCTTAAC AGCAATGATG TCATCTTGAT 9000 

CATCCGCATT CTGTTTAGCT TGGTATTCCT 9060 

ACATCGGTAT GTCATTTTGA TGGCGCGATA 9120 

CGATATAATC CACAAGTCGT TGCATCATTT 9180 

TCCATACACC TATAAATGTT TCCATCAATT 9240 

CAAATGGTGT GATTCGAATC ATTGTATTCT 9300 
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TTAAATGGGC ATTCTTTACG ATAGATTGAT ATTCCTCATC TGACACAGTT TCATTTCTAT 9420 

TTTTAAAAAA TGAATAACTT AATGATTTCG CTGGAATATG ATTGGCTATT TGTCGATTGT 9480 

5 GCCTAGCATC TGAAGCCACA ATCACATGAT CATCTTCATG TATTTGTTGT GCAATCATTG 9540 

CTTGAAATTT TTCTTCAATT AGTTGAGCCA TATTGTTATA TTCTGTTTGT TGATAGTGAT 9600 

GTTGATATCT TTTTGAAACA GTGACTCTGC CATTTTTCAA ATCTTCATGA AGTACACAAT 9660 

10 

CTCCATTAAT CGTTAAATAT TCTTGGTAAG AAGCCTCTCC CTGATCATCA AAATAACGTA 9720 

TCGCTGATAA ATAACCTCTG TCATCAAAAA TATAACGCCG TTGTAACTGA TCTCTTTCAA 9780 

15 ATTCTTCAAA CCAAATTGAA TACCCTTCTT GACTAAAATA AATATTTGTA TAGGTCTGTT 9840 

CACTCGTCAC ACATTTTAAT AAATACGGTG TGTACACAAA CTCAACATCA TCCGGCCATT 9900 

TTAAGTGATG ATAATTAATC GCTTGTGGCG CATGGTGACT GAATCCTTGA ATTTCATCAA 9960 

20 ACACAGACGA ATACTTTGTC TCATATAAGT CATATCGATG TAAAAATGTT CTTAAATTTG 10020 

GTGCATGATT GAGAACAATC AGTTGATAAT CTAAGTCATT TTCAAGGTGC ATTCCCATTA 10080 

AACTAATCAT ATCGTCAAAT TCCGTCTTAT TTTGTAGTTG ATAATACGGC ACAGTCGTGT 10140 

25 CTTGCCACCA TCGTTGGTCA TCGTACCAAG CTGGAATAAA GTATTTCATA ATTACCTCCT 10200 

TACCAATACT GGTTTAAAAA TGGCTTATAT TTATCAAAAT ATAAATATGT ACGAATTGTT 10260 

TCTGCAATAT TAATACTGAT GTAAACTAAT ACAATCAGTT GTACTGAGaA ATAAATTTCA 10320 

30 

GTAGATAAAT GCGGTACAAA CAATGTGAAA TAAAGCGGTA TACCAATAAT GACTGTAACT 103 80 

AATGCCAATC CAAACCAACA TACGCGTCGT GCTTGATAAT TTAAATAACG TTCTGTATCC 1044 0 

35 TTACCAGGTT TaACTCCTGA AAAATAATTG CCACTCTTTA AGAAATCTTT GGATTTTTGT 10500 

TTAGTATTGA TTAAAAATCT CGATAAAAAA TAACCCAATA ACATTTGAAT CACTAAATAT 10560 

ACTGAAATAC CTACTGGACT ATCAAATGTC AGCATTGGCA TGTCATCTGA TATGCTTTTA 10620 

40. TTAAACATAG ATAAAATAAA ATGAATGCCA CTTTTTAAGA AAACAAAAGC TGAAATACTC 10680 

ATCATTAAAG TAATACTGCC TGCAGGGTTA ACTTTCCAAG ATAAATAAGA TTTCATATTT 10740 

GTTGCGGAAA CGTTCATTAA ATCGATATAT GGTATTCTCA CTTCTACTAA TTCAATAAAT 10800 

45 

AATAAGATAA ACAATGTGAT TATCACAAGG ATGATTAACA ACGCAATCAC AATATGACTT 10860 

GCATCTATAT ATTCCATTTT TTGATGCATC ATTGATTTAA TAATACTAAC CATTACAATC 10920 

GGCATTGGTC CTGCGATGCC GTAGCGACTA TTTTTGTCAG CTAACCAAAC TAATAACATC 10980 

SO 

GTTCCAGTAA CCAAAATCAA TATTGTTAAG TAAATATTGT CTTGATGAAC ACGTTCTTTC 11040 

GAAACATATT CATGAATCAC AAAATAACTT TGAATAACAC TTAAAATTAA TGTTAAGATG 11100 
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GAAATCAGCA TCAAGATAAT CATTGATGTT 
TTTAAAGTAT TAACGTCTCC ACCCATATTA 
TTTACTTGCA TATCGTTaTA GGAAACGATG 
AAGATAAAAC ATGTGTATAG CATACGTTTA 
AGTTTTAACA TGTTGCACCT CTTTTATATC 
CTAATTATTA AAATCCTATA TCGATTTTTC 
TAGCCAGCTA TAAATTCAAT TTATGCTTGA 
TTCTTTCTCT TCATTAAACC TAAACCAACT 
TTTTGTTTTA TTGAGTCACC TGTATCTGGC 
TTATGTTTAG TCACTTCAGA TGTTGCACTT 
GTTGCTTCAC TTGATAAGCG AGATGTGCTC 
TCTGACGGAT GCATTGAGTT AGATTCAGAT 
GTTGAGTCAG AAATGCTTTG TGAACCAGAC 
GTCGMTCGG ATGTGCTCAA TGACGTTGAT 
ATTGATGTTG AGTCGGATTT GTCTTGTGAC 
ATTGATGTTG AGTCAGATAC GCTCGTTGAA 
ATGCTTGTTG AAGTTGAACC ACTTGTTGAG 
TCTGATGTAC TCAATGATTC TGAGTCACTG 
TCTACTGTAC TTTGTGAACC ACTGATACTT 
GTTGATAATG ATGTCGACAC CGATGTGCTT 
ATTGATGTTG ATATCGATGT ACTTAAGGAA 
TGTGACATTG AATCACTTAA TGATGTAGAT 
GTTGAACCTG ATATTGAGTC ACTTAAACTT 
ATTGAGTCAG ATGTTGAAAG TGATGTACTC 
TCACTTGTAG ACATTGAGTC GCTTTCTGAT 
TTACTTGTTG AGCTTGACTG CGAATCGCTC 
ATACTTTGCG AGCTACTCAA TGATTTTGAA 
GTGGAACCAC TTAAAGATAT TGATCCACTT 
TCACTCATTG ATATTGAATC ACTTAGcGAG 



AACCACGGAC CTAAtCCTAA AGTGAAAATG 11220 

GAAATAGCTA TTTTAAAAAA TGACTCATGT 11280 

GAAATGTTTG TGCCTAATAT ATAAATAaAC 11340 

TATATAATTT TATATTCGTA TTGTTGTAAA 11400 

AAAAACATTA AAAAGACTAA GGGTTCATCA 11460 

TAGTGATTGG TGCCTCAGTC TTTTTAATTT 11520 

GAATCATCTT GATCATTTTC ATCTTTCTTT 11580 

AATAATGTCA TAACGCCACC TAGTAATCCA ' 11640 

AATCTTTTTT CACTTTGTGC TGGTGTGCCA 11700 

AATGTAGACT GAGATTCACT CGTGCTCGTT 11760 

GTGCTGTGAG TATGATGCAT ACTCATTGAG 11820 

GTACTTGTTG AGCCGGACAT ACTTGTTGAT 11880 

ATAGATGTAC TCAGTGATTC GGATGTGCTT 11940 

GTGCTTGTTG ACACTGATTC TGAGTCACTA 12000 

ATTGAAACAC TCGATGAATT AGATTCACTC 12060 

CCTGAACCAG ACGTACTTAA TGATTCAGAT 12120 

TCCGATGTAC TTGTCGATGT CGAGTCTGAA 12180 

ATAGAAGTTG AATCACTTGT AGATTCTGAT 12240 

ATTGAAGTAG AATCACTGAT ACTGTCTGAT 12300 

TGTGATGACG ATGTACTAGC ACTCATTGAC 12360 

CCAGATGCAC TTGTACTTGT TGACTGGCTT 12420 

GTGCTTGTTG AGCTCGAGTC ACTTACACTT 12480 

GTCGATGTTG AAACTGAtwC GcTTCCGCTC 1254 0 

GTTGAATTTG ATCCACTGAT GCTAGACGAA 12600 

GCACTGATGC TCATAGAGTC AAATTGACTA 12660 

ACACTTGTTG ACGTTGATTC TGATCCACTC 12720 

TCACTTAATG AATCCGAAGT GCTAAGACTT 12780 

AATGAGTCGG AGTCACTTGT ACTAGTAGAA 12840 

GTAGACTyGc tTACGCTTTC TGAACCACTT 12900 
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TTTGAATCAC TTAATGAATC AGATTCACTC ACGCTTTCTG AACTTCTTAG TGACGTCGAT 13020 
ACACTTAATG ATGACGAATC GCTTGTGCTT ACTGAATCG 13059 
5 (2) INFORMATION FOR SEQ ID NO: 221: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 10758 base pairs 

(B) TYPE: nucleic acid 

10 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



15 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 221: 

AGGGATGGCC TTACCTAAAA AACCGGGnAA ACCCTCCAAA ACCCATTAAA AGGnTGGnTA 60 

CCCTTTAAAA TGGTAGCATT TAACCGCCAC CCGCCAAGGT GGGTGGTTTA TTCTTCCGTT 120 

20 ATTTAAATTA GTACACCATG CAGATTCTGT AGTTGAGGGA TATTTTAACG AAAGCTTATT 180 

AGCAACTGAT AAAAAAATAC GTCCTAAGGC ATATATTGCT TCATGGAAGG ACATCGAGCC 240 

GGCTAAGAAA ATAGAATTTA AAATTAAAAA AGGTATTAAA TGGCATGATG GTAATGAATT 300 

GAAAATTGAT GATTGGATTT ATTCAATTGA AGTCTTAGCT AACAAGGACT ACGAAGGTGC 360 

TTATTATCCA AGTGTAGAAA ATATCCAAGG TGCGAAAGAT TATCATGAAG GAAAAACTGA 420 

TCATATTAGC GGATTGAAGA AAATAGATGA CTACACTATG CAGGTTACAT TTGATAAAAA 4 80 

ACAAGAAAAT TACTTAACAG GATTTATTAC TGGACCTTTA TTAAGTAAAA AATATTTATC 54 0 

AGATGTACCA ATTAAAGATT TAGCGAAATC AGATAAAATC CGAAAATATC CTATTGGTAT 6 00 

TGGACCGTAT AAAGTTAAGA AAATCGTTCC AGGTGAGGCT GTTCAACTCG TTAAATTTGA 660 

TGATTATTGG CAAGGTAAGC CTGCACTAGA CAAAATCAAT TTAAAAGTTA TTGATCAAGC 720 

GCAAATTATT AAGGCAATGG AAAAAGGCGA TATTGATGTT GCGAATGATG CTACCGGTGC 780 

AATGGCAAAA GATGCTAAGT CATCTAATGC TGGTCTCAAG GTATTATCTG CGCCAAGCTT 840 

AGACTACGGT TTAATAGGtT CGTATCTCAT GATTACGATA AAAAAGCTAA TAAAACTGGT 900 

AAAGTGAGAC CAAAATATGA AGACAAAGAA TTACGTAAAG CAATGCTTTA TGCAATTGAT 960 

AGAGAAaAAT GGATCAAAGC GTTTTTCAAT GGTTACGCTA GTGAAATCaA TAGTTTTGTA 1020 

CCATCTATGC ATTGGATAGC AGCCAATCCT AAGGACCTAA ATGATTACAA ATATGATCCT 1080 

GAAAAAGCTA AAAAAATCTT AGATAAGTTA GGTTATAAAG ATAGAGATGG TGACGGATTT 1140 

AGAGAAGATC CTAAAGGTAA TAAATTTGAG ATTAACTTTA AACATAATTC AGGTTCTAAT 1200 

CCTACTTTTG AACCAAGAAC TGCTGCGATA AAAGATTTCT GGGAAAAAGT TGGCTTGAAA 1260 
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AATACGATTC CTGTTTATAT GCCATATATC ACATCTTATT TCATGACGCG TGCTATCGGC 1380 

GACAGACCTT TAGTCGTCCC GCATCAATCT CAGAACTTAG CATTTATTGG TAACTTTGCA 1440 

GAAACAGAGC GAGACACTGT ATTTACAACA GAATATTCGG TTCGTACTGC CATGGAAGCT 1500 

GTTTATCAAT TACTAAATAT AGATCGTGGT ATTCCAGAAG TCATCAATAG TCCATTTGAT 1560 

CTTCGCGTCT TAATGGATGC CATATACGAA CTGAATGACC ACCAAGATTT GCGTGAGATT 1620 

ACTAAAGATT CGAAAATGCA AAAACTCGCA TTAGCAGGAT TCCTTAAAAA GATAAAAGGT 1680 

ACGTACATTG AGTCATTATT AAAAGAACAC AAATTGTTAT AACGAAAACC ATTAATAGAT 1740 

TTTTATTTGG TGATTTCAAA TCATGAGACT GGGACAGAAA TGATGTTTTC ATAAAAATTA 1800 

TTTCGTTGTT CCACTCTCAT GATTTTTTTG ATGAAACATA ATTACATGAT TGATTGCATC 1860 

ATTTTGTTAA ACAAGTGATT GCAAACCTGC CATTTCACAC TGAAAATTTA CATAATAAGT 1920 

20 GACGATATTT TACAAGTCAT ATACAAATAA CATATATTGT TAAATAATTT TACCTAATCT 1980 

TAACATTAAA TTTACAATTA TAAGCGATAA TCTAAATATA AAGCTTATTT GAGGTGAAAT 2040 

AATGGAAATG TCGGTTACAG AAGTCATTTT CTCCTTTTTA GGTGGTTTAG GTATTTTCCT 2100 

TTACGGCTTA AAAATCATGG GAGACGGGCT TCAAGCATCA GCAGGAGACA GGCTACGAGA 2160 

TATTTTAAAC AAATTTACAT CAAATCCAGT ATTAGGTGTT ATTGCAGGTA TCGTTGTAAC 2220 

TATTTTAATA CAAAGTAGTT CAGGTACGAC AGTTATCACA ATCGGACTGG TAACAGCTGG 22 80 

ATTTATGACA TTGAAACAAG CCATTGGAGT GATAATGGGT GCTAATATCG GAACAACGGT 234 0 

AACTGCATTT ATTATCGGTA TAGATTTAGG CGAATATGCA ATGCCAATTT TAGCATTAGG 2400 

TGCATTCTTA ATCTTTTTCT TTAAACGCTC TAAAATCAAT AACATTGGCC GCATACTATT 24 60 

CGGTTTCGGT TCACTATTCT TCGGTCTAGA ATTTATGGGT GATGCCGTTA AACCTTTAGC 2520 

ATCATTAGAT GGATTTAAGC AATTAATGCT TGATATGTCT ACAAATCCAA TACTCGCTGT 2580 

40 CATTGTCGGC GCAGGGTTAA CAGCACTAGT TCAAAGTTCA AGTGCGACGA TTGGTATTTT 2640 

ACAAGAATTT TATCAACAAG ATTTAATTAG CTTAAACGCA GCAATCCCTG TGTTACTAGG 2700 
CGATAACATT GGTACCACGA TTACAGCTAT CTTAGCTAGT TTAGCCGGCT CAATCGCTGC ' 2760 

AAAACGTGCG GCGCTTGTAC ACGTCATCTT TAACTTAATC GGGGTAATTA TCTTCACAAT 2820 

TTTCTTGCCA GTTGTGATTC ATTTGATTAG TTTGTTACAA GATTTATGGC ACTTAAAACC 2880 

AGCGATGACG ATTGCAGTAT CACATGGTAT CTTCAACATA ACAAATACTT TGATTCAATT 2940 

ACCATTTGTA GCAGGTTTAG CATGGATTGT TACAAAGCTT GTCCCAGGTA AAGATATTGC 3000 

TGATGACTAT AAACCTCAGC ACTTAAACAA AGATCTTGTT TATCACGCAC CTGGTGTTGC 3060 
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AGACATTCGC GAAATTACAA AAGACGATAA 
TCAAGCTGTT GAAACAATCA ATGATAGCAT 
5 AGCCATTACG AAGGCAGACG TTGAGCGTTT 

TTTAAAAGTA GCAGAGCTAA CAGAAGAGTA 
AGATATTCGC ATTACAGAAG ATGCACAACG 

10 

TGAGTCATTT GATAAAGCCA TCGACATGTT 
AATTGTAGAA CGTAGTAGAG AATCATTTAA 

1S TAAACGCCTT AATCGTGGTG AATGTACAAC 

TGGTGTTCTT GAACGTATCG GTTATCATTC 
TAACGATGAT GTACCTACAG ATGAAGAAAT 

20 TTATTTATAT TCATATTTTT TTAAAATTAG 

ACATTCATGG GTTGGCTTTT TTGTTTAGCA 
CTGATATAAT AATGCTTCAT TAGTATGCGG 

25 GACCCCGAAA CGTTTAATAT ACACTTTTAC 

ACCTTCACAT TATATATAGT TCTTTCCATA 
AAATAACCAT CCACCTAACT TATCAAAAAT 

30 

ATTTATATTA GTGTTAATCC AATCATAGAT 
TCATTTAATT TGCTTTACTT TCATTTATAT 

3S ATTATTTCGC ATCTTTGACA CGTTTATCAT 

ATGCCATGAT TCCCATTAAT ACGTTAACCC 
TCGTTGCAGC AACTGCACCA GCATATACAG 

40 CAAGTGATGA AGCCATTTTA TAAATACCTG 

TCGAAATAGC TGTATCTGTA GAAGGTGTTG 
AATATCCTAC GACACAACTG ATAACATAAA 

45 

GTGCAATACC AATGACCACA ATGAATGTAC 
TTTGTAATAA TTTTTCACCA ACTCGAATCA 
ATAAGTATCC TGCCTGCAAT GCTGTATAAC 

50 

CAATTAATGT ACCTGCAAAA CCGTTTAATA 
GTTTATTTTC AAATAATTTA AAATCAATAA 

55 
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AAAATTGATC AAAAAGCTTG AACAAAAGCA 3180 

TCGAAATTAT TTAGTTAGAA TTTCTACAAA 324 0 

AGCAGTTATG TTTGATGTCA ATCGCTCTAT 3300 

TGTCGCTCAA TTAAAACGCC AACATGATGA 3360 

CGGTATGGAT AAATTATTCA ACCATGTTGC 3420 

AGATGTTTAT GACAAAACGA AAAAAGATGA 3480 

TATTGAACAT AAACTACGCA AAGGTCATAT 3540 

AAAAGGCGGA TTACTATATA TCGATATGAT 3600 

ACGAAATGTT TCTGAAGCAC TTGTTGGCCT 3660 

TGCAACAACT GAAATTTAAT TTTTACTGTC 3720 

AGATTCAGAT GCATGTAAAA AGCCAATCCA 3780 

AAATTTATTA TCTTAAATCG GCTATAAACA 3840 

TAAGCATGAC GGACACTGTT CTCGGAGTCT 3900 

ACGTCGCCTT CATTGAAGCG AATTGCCATA 3960 

TAAATGTCCA AATTTTTAGA ACAACGCAAT 4020 

TTAAGTGGAT GGTTTTTCAT TTTCATTTAT 4 080 

TTATCTATAT GCACTGCTCT ATACATTTCC 414 0 

CATTATCAAA ACACTTGGCG TGTCATCGTT 4200 

CATTAGGAAT CGCGAATAAA ATTGCGATAA 4260 

AAAGTGCAAT CATCGCACCT GTATGAATGC 4320 

CACCACTAAT TGCGACACCG AATGCGCCAC 4380 

AAGCAACGCC AACTTTATCT AACGGTGCAT 4440 

CATAAATACC TAAGCCTAGT CCGAAACATA 4500 

ATATGCCTGG TAAGAATACT AATGAAATAA 4560 

CTAATAACAT TGGTCGCTTA' GAACCCATTT 4620 

TCAATAACAC CATGATTAAA TAAGTAATTG 4680 

CTAAACCTTG TTGCACGAAT GTATTCGCTA 4740 

AGAAGTTCGA AATCGTTGCA CCTGTATATG 4800 

GTGGATTATC TACTTTTTTC TCAACATTTA 4 860 
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AACCAAGTGC TGCACCTTTA GTAATGACAA 
CAATTAGCCC TGCAACGTCA AATTTATGTG 
5 TCCCTTTGAT GAGTAACATT GAAAGTACGG 

TCCAACCCAT AGTTGTCGCA ACTGCACCAC 
AAGAACCGAT AGACCAATAA CTTAAGGCAC 

10 

TCATAATGGC CAATGTAGAA GGCATAATAC 
CTAAAATTAA TAATGCCGGT AAATTCGTAA 

J5 ATAATAAACC GATATTCGTC ATTTTCACGC 

CAACAACAAA CATGCCTGAA AATAGTGCAG 
TGTCTGTACC AAAACTTTGT TGTAAATTCG 

20 ACCAAAATGT AATAACACCT AATACAATAC 

TTTCATTCAT GTTAGTTATC TCCTTTAAGG 
GCAGAAATAA GTAATGATTT TTCTGAAATG 

25 TCACCATTTT CCACCGCTGC ACCTGTATAA 

TATGCAAAGT CTTCTGAAGG TGGTTGTGGT 
GCTTCTTTCA ACGTCTTAGC CACGTACTCA 

30 

TAATCATCGT TATATTCTAA GGTGCAAGTt 
AAACGTTTAA TTTCTTTTTC AATTGTTGCT 

35 CCTTCAATTT CAACAACATC TTTAATGACA 

ATTGTGACAA CACCGGTTTC AAATGGACTT 
GTGACGAAGT AGCTACCTGC AACAATGGCA 

40 CCACCTTTAC CTTGAACTTT CAATTTGAAG 

CTGTAATACA CTTTACCTGT TTTCATTGTG 
ACACCGTCTA ATACACCATT TTCAATCATT 

45 

GCTGGTTGAT GTATCACAAC GACTTTTCCT 
TCTGCTAATA CAAGCATGTA TGCTGTATGT 
TTATTTTGTG ATGCAAAAGA TAATCCTGTA 

SO 

GCACGGATTG CTAATGTTTT ACCAGGTTTC 
GGTCCGACAT TCGTTTCTAC TTCCACATCT 

SS 



CGTTTAAACT TAGCAACATA ACTACTAGAA 4980 

TATTGGTAAT TTCTGATTTC GTTTCAGGCG 5040 

CAACGATAAT TGAGAAGATG AAAATCCATC 5100 

CGAAGAGTGA ACAGATACCA CTGCCACCCC 5160 

GCTGACGTTC AGCACCCTGA TAATAAGTTT 5220 

ACGCTGCTGA TACACCTTGT ATAACACGAC 5280 

TAATAATTAA TGCTGAACCA ATAATACTTA 5340 

GCCCAATTTT ATCTGCCAGA CCACCTGCTC 5400 

TTAGACTGAC CGCAATACTA ATTGTCCCCA 5460 

GTACAACATT TACAAGTGAT TGTGCAAACA 5520 

CTAAGATTAA CTTGTTGCCC CCGCGATACG 5580 

TAATCTAAAA CAACTGTCCC TACTGCTTCT 5640 

TTAAATTTAG GATGATGATG TGGGTAAATT 5700 

ATAAAGGCAC TTGGGCGTTC TTTAGCATAA 5760 

TCACACATTT CAACACCAAA ATCAAGGTTT 5820 

GTAAACTCTG GATCATTATA TAATGCTGGA 5880 

ACACCATACA TATCCTCTAA TCCTTTTGAT 5940 

TTTGTAGCAT CTGTTAATCC ACGTACATCA 6000 

TTGAATTGAC CTTTACCGTC AAATGAACCG 6060 

AGTCGTCTAG ATACAACTGT TTGTAACGCT 6120 

TCATTGGCCA TATGTGGTGA TGAACCATGA 6180 

AATGCGCGTC CTGTTTGAAC ATAACCAGGT 6240 

CTCATGACGT GTACACCTAA TACATGATCA 63 00 

GTTTTAGCAC CACCTGGTGG TACTTCTTCA 6360 

GTAAAACTAT CTTTCATTTC AGCAAGCGTC 6420 

GCATCGTGAC CACATGCGTG CATAACACCT 6480 

TCTTCAGTAA TGGGTAATGC GTCAAAGTCT 6540 

CCTGAATCAA TCGTTACTTT AATTCCACGT 6600 

TTACCTTTGT AAAATTCAGC GATGTATTTC 6660 
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ATCATTTTGC CTTCTTTAGA TTTTAAAGTT TCAATTAATT GTTGATTCAT ATCCTTCATC 6780 

TCCTTAGTTA CATCATAAAT GATTAATCAT TATTTATATT GCCAACAACA GAGATGTTAA €84 0 

5 

CCATTAATTT TTTGCAATTT TAGCTTTGAA TATAAAAAAT CACAAATTAT GTATATCAAA 6900 

ATTTGTGATT TGTGATCATT TTATGAACTT GGGTAACGTT TTACTTCAAT TAAGTGAATC 6960 

CCATTCGTAA TCATTTTAAT GTTTAATGCC AGTGTGTCCG TGATATCTAT ATCATATACT 7020 

10 

TCTAATTTCG GAAAACTCAT TCGATTAACG TAATCTATAG AGTCCTTGTC CATGCCATGT 7080 

ATCGTATGAT GTTTGCGCCA AAGATTAAAT AACGCACCAT TTTCTTTATC TAAGGTAAAA 7140 

1S TGTTTAATCT TATACATACC TTCTTCCAGG GCATTAATGT TCAAATGAAT CATTTCCGTC 7200 

GCACGCATAT TCATTTGATT GTCCAACGCT AAGTACGGAT TAAAATGCTT TGCATCATAT 7260 

AACAATATTT GAAAATTTGA ATCAGTCCCC GTGACAATAC ATGTATCATC AGAATACAAA 7320 

20 ATATTGCTTG TTAATTTATT AAATAGCAAT GCCGTGAAAT AGACCGGACG TTTTCCATTA 7380 

TATTGATGAA ATAGTTCAAT AGAATTCATA TAATCCCGTT CATTTTTACA ATGACTGACG 7440 

TGCAAATCAT AATTCAACCA ATACCCGATA CCCTCTACTT TAGAACTTAA TTTTAATAAT 7500 

25 

TGCTCAATGA TGATACCACC TCTAAAATAT TCGCCGTTTG TAATAAATGT ATCACCCGTC 7560 

AATGTATTCC AATTGAGTAA AATGAGTGGA CGCTTTAGGC GATGACGATG CATTAAGTCG 7620 

ATAAGGTAAT TCGTTTTATT AATAATCATT TGACTCGCGG TTTTAAATTC ATCATCATTC 7680 

30 

ATTTTATTAA AATCAACAGC GTCATTTGAA TTGGCATCAA ATACAAAATG GTCGATGTGT 774 0 

GGCTCAAGTC GTTTCAATAA TGGTAGATGT CTTTCCGTAG CTTGATCTAA GTGAATGTAC 7800 

35 AAGCCACCAT TAGGGAATAA TGCTTTAAAA TAATCAATCA TTTCAATCAA AGACGTGTGC 7860 

AATGTCGTCA CATACAAGTT GAACTTCAAA TCTTTTCTAT GACTGACATG CAGGGCAACG 7920 

TGATGGATAA AAATTTTAAA TGCATCGATA TAATCACGTG AGTCATACTG ATCCAAATGC 7980 

40 ATGGTCAAAC TAAAGTTATG ATCTAATAAA AAGTCTAAAC ACAAATCAAT ATCATAAAAT 8040 

ATATTCGAAA TTTCTGCATC ATACGTGAAT GGCGCATTGA GCTTTTTCAT GATATATGGA 8100 

ATCACATCAT ATGCTAATAC TTCATTGACT TGAAAATCAT GATGACATGT AAGCAACTGT 8160 

45 

GATTGATACT GTGTATTGAG CAAATTCCTC AAATAGCCCA CTTGAATAAT ATGATTAAAT 8220 

TGATTTAGTT GGTGATTGGT TGGTTGAAAG GCAATCTCTT TATAGTTCAT CTTTTCAATA 8280 

TCTTCAATAA AATGATTCAT TTCTTCAATG TAGTCATTTA AAAGTAATAT CAATTCACGG 8340 

SO 

TCGTGATAAT CATGTTGTGC CGATTGCTGG TTTTCAGTGA TTGCTGGACG ATCACCTCGA 8400 

TATTGTTTAG GTGTTTGATG CGTAAAGTGT TTAAATGTTC TCGCAAAGCT CGCTGCACTT B460 
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1 I LLtCATGCT 


CAATTCGCGT 


CGTATTTAAG AAATGATGGA ATCCTACACC 


TAGCGATTCT 


8580 


GTAAACTTTT 


TAGACAGATG 


GCTCTCTGAC 


CACCCAACGT ATTCGCTTAA 


TTCTGAAAGG 


8640 


CTTAAATCTT 


CATGAAAATG 


TAACTCGATA 


TAGTCGCATA 


CTTGATTCAC 


TTTATCATCA 


8700 


TTTAAGATAC 


TTTGGTTCGA 


ATGATATGTA 


CGCGGGACAT 


AATGAATCAT 


ATGCATAAGC 


8760 


AACTG AAT CA 


CAAGTTGTTG 


CTCAGTCAAT 


TTAGACAACT 


CATTATGTCG 


GATATGTGTT 


8820 


GAAACCAGTC 


TTGCCATTAT 


ATTTCTCAG T 


TGATGTATAT 


TCTTTGTTGT 

X XXX \J X X \& X 


GGTCGCATCT 


8880 


GTTAAG TGAA 


AATATAGACA 


ATGCACATCA 


TCAAACTTGT 

X V*WIW X X \J X 


W X wVp A mrnmrnmrn X *» 


TTTCATTTGG 


8940 


AATTGGATAT 


AACATATGAT 


GCCATCTTGT 


TGAAGTTGAA 


ATCGATACAA 


GTCGCGGTGG 


9000 


TTAATGATGA 


AAATGTCGCC 


ACTGTTGCAT 


TGCGTCATAT 


TATTTTGATC 


ATAAATGTGT 


9060 


GCCTCnCCTT 


TAATAACAAA 


ACCAATCATT 


A A A fT ATTG A 


X X X XKXrV\ 


ATCTGACATA 


9X20 


CTCTCAGTTT 


CTACTCGAAT 


TAAATAATCA 


CGTTGCATA C 




TTCAGTAATA 


9180 


TGAATACGTT 


TATTTTACAT 


TA'i"i~i~rAf , AfZ 

X i» X X A 1 Awlw 


C A A AT ATTT 


GAATTTC*ATA 


TTGAATCGTG 


9240 


TGTGTGGATG 


ATTATTTATC 


CTCACTCGGT 


TCAAGATGTA 


GACTATCAGT 


AAAAAAAGTA 


9300 


TTTTCACCTT 


TTTTCTCCAC 


AAAAGTAAAT 


TCAATGTCTT 


TATATCCAAC 

X AX AX VvX^An^ 


TGrTGaACCT 


9360 


TTTAAGTCTC 


CCgAACCTTT 


CaACaATAAC 


TTTGGTGfTT 

A X A VJW X VJV i i 


TATTfGTTWS 

mi i\>oi x vjvj 


TATTTTATAT 


9420 


CTTTTTCGTA 


ATTGTTTTAC 


ATTATAGTCA 


TCATTAGTTA 

x x x rw x x ** 


ATTGATATTT 


TGCTGAATAA 


9480 


CTCGGTACCT 


CTGGATTATA 


TGATATATCG 


CCGTCTTTGT 


ACTTCGACAA 


ATCTTTAAAG 


9540 


CTGCCATATT 


GCGCGAAGAA 


CTTAAAATTC 


TCGATTTCTT 


TTTTTATATT 


TTCGTCTTTG 


9600 


ATACCTTTAG 


TTGGAATGAT 


TTTATTGTCT 


ACCATTTTAA 


CGGGATATTC 


TTTATCTTTA 


9660 


CTCTTAGGTC 


TACCATCTTC 


ATCATGAAGT 


GTTTCACTCA 


CTATATACTT 


CCCGGTTGTA 


9720 


GTCTTAGTGT 


TTCTATTCAT 


ATATAGAACC 


ATACCTTTTG 


ATTTCATACG 


TTCCCCTTTA 


9780 


GGTTGAACAA 


CCATTTCAGA 


ACCAATAATC 


CATGTACCTT 


TATCATTTTT 


ATCAAATTCG 


9840 


TCATCACGAT 


AACCTTCTTT 


ATCGTATAAA 


TCCTCTAGAT 


TTTTAATCGG ATACATACTC 


9900 


AATGTTTTTT 


CAAAGCTTTT 


CTTAACTTCC 


GCTTCTTTAC 


CTATGCCACA 


ACCAGCAGTG 


9960 


AAACTAATGA 


CTAATATCAA 


AAAACTAATA 


TACAATACCA 


ATTTGTTTAA 


TCGTTTCATA 


10020 


ATTTCACAAT 


CCTATTCTTC 


TTATTATCTT 


TCCTGGATTG 


ATTTCATATT 


TTQATCGAGT 


10080 


CATGATTATT 


TATCCTCACT 


TGGTTTAAAA 


ATTAACCCAT 


CACTAAAGTA 


AATGTTCTCT 


10140 


TCTTTTTTCT 


CTACAAACGT AAATTCAATG TCTTTATATC CAACTGATGA ACCTTTTAAA 


10200 


TTCCCTGTAC 


CyTTCAACAA CArCTTCGGy GCTTTATTTG TTGGTATGTC ATATCTTTTA 


10260 
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w 



15 



20 



ACCTCTGGAT TATATGATAT ATCTCCATCT TTATAATTCA 
TATTGCGCAA AAAACTTAAA GTTTTCGATT TCTTTTTTTA 
TCAGTAGAAA TGAATTTATT ATTAATCATT TTAACTGGAT 
GCTACTTCGT ATTTCTCCGT CTTTAtTTCA TTAGTATAGT 
GTATTTCTAT CTATCTTCAA AAGCATGCCT TTTATTTTTA 
ATTGCCATTT GAGAATTTAC AATCCATGTT CCCTTATCAT 
CGATATCCTT CTTTATCGTA TAAATCCTCT AGATTTTTAA 
TTTTCAAAAC TTTTCTTT 

(2) INFORMATION FOR SEQ ID NO: 222: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1109 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 




AAAATTGCTA 
TTTAACTTCC 
ATTATCCTGA 
TGCACTTCTT 
TTTATTTTGA 
TTGATCATCA 
ACTCAATGTT 



10380 
10440 
10500 
10560 
10620 
10680 
10740 
10758 
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30 
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- (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 222: 

nTaTCaACTT TGGaATTTAA AgTCAATAAC TTTTTTAAAA ACTTTTTGTG TTCACAACCC 60 

GCTTCTTTTT CAACGCGTTT ATTGCTTAAC ACAAGAACTT ATTTTACCAG CATTCCAAAA 120 

CAAATCAACA TAAAAACGTA CAAAATAAAA GTAATTTTGT ACGTTTAGCA TATATTATAC 180 

CTATTTATTT GTAGCAGCTA TAACTTTTTG TGCAATCGAG CTATAAATTT TACCTAGACG 240 

ATCATCTGAT TGATATATTG ACGGTGCAAA ATCTTTTGGA TTCCAAGATG GTTGCTCTAA 300 

AGGTAATTCC CCAAGTAATT GAGTATTAAG TTCATCAGCT AACTTAGTAC CGCCACCTTT 360 

GCCAAAGACA TATTCTTTAT TACCCGTCTC TTTACTTTCA AAATAACTCA TGTTTTCAAT 420 

TACGCCAAGA ATAGAATGAT CCGTATGTTT TGCCATCGCA CCTGCGCGAg CTGCAACAAA 4 80 

TGCTGCTGTA GGATGAGGTG TCGTTACAAT AATTTCCTTA CTTGAAGGTA ACATCGTATG 540 

AACATCTAAA GCTACATCTC CTGTTCCAGG TGGAAGATCG AGTATTAAAT ATTCAATGTC 600 

TCCCCATTTA ACTTCTGTAA AGAAATTCGT CAACATTTTA CCTAACATTG GCCCTCTCCA 660 

TATAACTGGC GCATTTTCTT CCACAAAAAA GGCCATTGAT ATAACTTTAA CGCCATGACG 720 

TTCAACTGGA ATTACTTCCT TCCCTTTAAT TCCAGGCTTT TCATCAATAC CCATCATATC 780 

TGGTACACTA AATCCATATA TATCGGCATC TACTAATCCG ACTTTTTTCC CTTCACGAGC 840 

TAAGGCAACG GCTAAATTTA CTGCAACAGT AGATTTACCG ACACCACCTT TACCGGAGGC 900 
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ATTTTCTTCT TTTGGTTTAA ATTGATTTAC TTTTTCTTCC GGCAATGTTT CAAATCGTAT 1020 

ACCGACCGTT TTCGCACCGT TTTCTTTTAA TGCATTAACA ACAGCCATCT GTAAATCTAA 1080 

aTTGCGtGCA CCACCTAATT GTGCCATTG 1109 



(2) INFORMATION FOR SEQ ID NO: 223: 

(i) SEQUENCE CHARACTERISTICS: 
70 (A) LENGTH: 3997 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

15 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 223: 

TCTTTATTTA AAAAAATGAT TGTCTAGTTT GTATCTCTCT GAAGATTTGG CAATAAATAA 60 

20 AAGCCGATAA CCGTATAATG ATTATCGACT TAAAGTTTAT GTGGCATTTT TTACTTTTGT 120 

AATTTCAGGT GAGTTAGATG ATTATTATCA GATAGATTAT TGCTTATAAT CATATGATGT 180 

TTGAATGATA TCTTTGATTT CACTGATTAG TGCTTCTTTA GGATTAGCAG TTGTACATTG 24 0 

25 ATCTTCAAAT GCGAGCTCTG CCATTCTATC AATTGACTCA TTTAATTCTT CTTCAGACAC 300 

ACCTTGTGAT TTCAAATTCA TTTCAATTCC GACTGATTGA CCTAATTCGT AGACAGCTTT 360 

AgCTAATGAT TCTACGAGTG CTTCTGTCGT ATTACCTTTT AATCCTAAGA ATTTGGCAAT 420 

30 

ATCTGCATAA TCTGTATCTG CTCTGAAGAA CTCATATTTA GGGAATAATG CATGTTTTTG 4 80 

CGGGTCTTTG GCATTATAAC GGATAATATG CGGTAGTAAT ATCGCATTCG CTCTACCATG 54 0 

CGGAATACCA TATTCGCCAC CAATTTTATG CGCAATTGAG TGTGCAATGC CTAAGAATGC 600 

35 

ATTTGCAAAT GCCATACCAG CCAAAGTTGA TGCGTTATGC ATTTTCTCTC TTGAAACTTT 660 

ATCACCCTTT TCAACAGATG ATTTTAAATA TTCGAACGTC AATTTAATCG CTTGTAGACT 720 

40 CAAACCTCTT GTGTAGTCTG AAGCCATTAC AGATACATAT GATTCCATTG CATGCGTTAG 780 

TACATCCATT CCTGTATCTG CTGTAACGCT TTTTGGCACA CTCATCACAA ATTGAGGGTC 840 

AATAATTGCA ACGTCAGGTG TTAAAGCAAA ATCAGCCAAC GGATATTTTA CATTTGTTTC 900 

45 ACTATCTGTG ATAACTGCAA ATGGTGTTAC TTCTGAACCT GTACCTGATG TCGTAGGGAT 960 

ACAAATGAAC GTCGCATTTT CAGGCATGCC TATTTTATAA GTACGTTTAC CGATGTCTAG 1020 

GAACTTTTGT TTAGCACCGA AGAATGATGT CTCAGGGTGT TCAAAGAACA TCCACATTGC 1080 

50 

TTTTGCAGCA TCCATCGCTG AACCACCACC AAGTGCAATG ATTGTATCCG GTTGGAAATC 1140 

AACCATCATT TCCAGACCTT TATATACTGT ATTAGTTGAT GGGTTCGGTT CGACTTCGCT 1200 
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ATAACCGAAT 


TCTACCATAC CAGGGTCACA GACAATCATC ACTTTTTCAA TCTTGTCCAT 






TGTTGTTAGA 


CTCATGATTG CATTTTCTTC AAAATAAATT TGAGCAGGCA 


CCTTGAAAAT 


1380 


5 


TTGAGTATTA 


TTACGTCGTT TAGCAATCGT TTTAATGTTT AATAAATCTG 


TCGCACTAAC 


1440 




ATTATGTGAA 


ATTGAGTTTC TACCGTAGaA CCACAACCTA ATGTTAAAGA 


CGGAATCAAT 


1500 


10 


TCGTTATACA 


TATCACCAAT ACCTCCAACC GCTGATGGTG TATTTACAAG 


TACACGACAA 


1560 


GCTTTCATTC TTAGTCCAAA ATCTTTTTGT AATGTTTCAT CTTCTGTATG 


GATAACGGCT 


1620 




GTGTGTCCTA ATCCACCAAA ATGTAGTGTG TCTTCACAAA TTTGAAATGC 


TTGTTTTGTA 


1680 


15 


GATTGGGCTT TTACTAAGGC TAATACTGGA GATAATTTTT CACGAGATAA 


CGGATAGTCT 


1 740 




GAACCTACAC 


CGCTAATTTC GGCTATGATA AGTTTTGTAT TTTCGGGGAC 


AGGTATACCT 


i Ann 




GCTAATTCAG 


CTATTTCAAC TGCAGATTTA CCGACAATAT CAGGCTTAAT 


ACCTGTTTTT 


loou 


20 


TGTTCATTcA TAATTGCATT TTCTAAGCGT TGTAATTCAT CTTTTTTAAC 


AAAGTATGCT 


1 OA 




TGATGTGCTT 


TAAATTCATT AGTAACATCT TTATAAATTT CTTTATCAAT 


GACTACAACT 


1?BU 




TGTTCAGAAG 


CACAAATCAT ACCATTATCA AATGTTTTTG AACCAATGAT ATCATTTACT 


ZUfi U 


25 


GCACGTTTAA 


TGTGTGCTGT TTTTTCAATG TAAGACGGCA CGTTACCTGG 


TCCCACACCT 


«xuu 




AATGCCGGTT 


TGCCAGTTGA ATATGCAGAC TTAACCATGC CCGAACCACC 


TGTTGCTAGA 




30 


ACTAATGCAA 


TACCTTTGTG ATTCATTAAT TGTTTTGTTG CTTCGATAGA 


AGGCACTTCA 




ATCCACTGAA 


TAATATCTTT AGGTGCACCT GCCTTCATTG CCGCTTCTAA 


TACAACTTCT 






GCTGCACGCT 


TCGACGATTC TTGTGCACTT GGATGGAATG CAAAAATGAT 


TGGATTTCCT 


2340 


35 


GTCTTAATTG 


CAATCATCGC TTTAAAAATA GTTGTCGACG TAGGATTTGT 


TGTTGGCGTA 


24 00 




ACACCACAAA 


TAACACCAAT TGGTTCCGCT ACATACGTTA ATCurriTTC 


TTTATCTTCA 


2460 




CCAATAATCC CTACTGTCTT ATTGTCTTTT ATTGAATTCC ATATATATTC 


AGAAGCGTAT 


2520 


40 


AAATTTTTAA 


TCGCTTTATC TTCGTATATA CCTCTTCCAG TTTCTTCATG 


TGCTAATTTT 


2580 




GCTAGCACCA TATGTTGATC AACAGCTGCT AAGCTCaTTT GATGAACAAT 


ATGATCAATT 


2640 




TCTTCTTGTG ACTTTTTAGA TAATGCTTCT AATGCTTTTT TCCCTTTGTC 


AGCTAGAGCA 


2700 


45 


TCAATCATAA 


TTGCCACTTC TTGTTCTTTC GATCCACGAT TTTCTTTTTC 


AGGTATAGTT 


2760 




AACATATACA ACCACTCCTT TATACTTTGT GAATTATTTC ACAAACATTA 


TAGTACATGT 


2820 


50 


CTCTCAGGAT 


ATAAAGAAAA TTCT ATACAA AAAAGTTTAA TTTCGAATAT 


TATTTGAACA 


2880 


AATATCAAAT 


TTTAAAATAA ATGTTTTCAT GAAATCATTG TTATTTCGGT 


GTTTTTAGAA 


2940 




TGATTTTATA 


ATCATAATTT TTTCAATGAC ATAATTTATT CATAATTATA 


TATTTAATTC 


3000 
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TCCTTGTCGA TACCTATCAA CAGATGTTAC AAATAAAAAC CaCCCGTGTG AACGGGTGGT 312 0 

TTGTTCTGCG gCTATAAGCC TTCCTTACTG GCCaGCCCTA AAAGGGCACT GACAAGTCAG 3180 

CCAACTGCAC TACTATTCCA GCAATCCTAA AGGTTTACTC TTTTTTCTTT CTTTTTTTAT 3240 

TTTTCTCTCC AGTGAAAGGA TCTAAATATT CTTCCATTGA AATTTCATCT GCAACGATAT 3300 

CCTCTTGTAA TTGATTACGA ATATAATTTT CAATCACTTT TTTATTTCTA CCTACTGTAT 3360 

CCACATAAAA TCCTTTACAC CAAAACTTTC TATTTCCATA TCTATACTTT AAGTTAGCAT 3420 

GTCTATCAAA TATCATTAAA TTACTTTTCC TTTTAAATAG CCAACAAATG ATGATACCCC 3480 

75 AAGTTTGGGT GGTATACTTA CTAACATATG GATATGATCT TTACATACCT CTGCTTCAAT 3540 

TATCTCTACA CCTTTTCTTT CATATAATTG ACGTAATATA ATCCCTATAT CTTTTTTTAT 3600 

TTTTCCATAT ATCGCTTGTC TTCTGTATTT AGGTGCAAAG ACAATATGTT ACTTACAATT 3660 

20 CCATTTCGTA TGTGCTAAAC TGTTTGTGTC AGATGACATT AAATAGCATC TCCTCGTGTT 3720 

GATTATTTTG GTTGGCTGAC CAATATTTAC TCTAACATGT AGAGATGCAT TTTTTTGACA 3780 

ATGGTAGAAC CTTTTCTGGG GAGTGGGACA GAAATGATAT TTTCGCAAAA TTTATTTCGC 3840 

CGTCCCACCC CAACTTGCAT TGTCTGTAGA AATTGGGAAT CCAATTTCTC TTTGTTGGGG 3900 

CCCCGCCCCA ACTCGCATTG CCTGTAGAAT TTCTTTTCGA AATTCTCTGT GTTGGGGCCC 3960 

CTGACTaGAA TTGAAAAAAG CTTaTTaCAA GCGCATT 3997 
(2) INFORMATION FOR SEQ ID NO: 224: 



25 



30 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1391 base pairs 
3 5 (B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



40 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 224: 

GnGCGAGACA AACACACtTA TTGGTGCCAT TATmCcTAGA ATGaATTCaT ATGCAGTAGA 60 

TGAaaCAATC AAAGGATTGG CAAAACAATG CCAAAAATAT GAATCaCAAT TAATTTTAAA 120 

TTACACAGGT TTAAATATCG AAGCAGAAAT ACAAGCGCTT GAAACATTAG CACGCaGTAA 180 

AGTAGATGGT ATTGTTTTAA TGGCTACAGA CATAACAGAG AGACATATTG AAGTCATTAA 240 

TAAAATGAAT GTACCAATCG TTATTGTTGG TCAACAACAT GAACAACTTC ATAGTATTGT 300 

GCATGATGAT TATAAAGCAG GTCAAATTAT AGGCGAATGG ATTGGTCAAC AGGGATATCA 360 

ACAAGTTGAA GTGTTTAGTG TAAGTGAAAA AGATATTGCA GTTGGTATAC ATAGAAAACG 420 



45 



50 
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TACTTATGTG GAAGCACAAA AAGATGTTGC AAATGTTTTG GAAAATGTGG AGCAAGTAGA 540 

TGCGGTTGTT GGAGCAACTG ATACGATTGC ATTAGCTGCC TATAAATATT ATTCTGATAA 600 

AAAAGATGTT ATGAAACCAC ATCAAATATA TGGTTTTGGT GGTGACCCAA TGACACAATT 660 

AGTGTCTCCA TCGATAAAAA CAATTCATTA TAATTATTTT GAAGCTGGCC AATGCGCGAT 720 

GGaAGAGATA CAACAGATGC TTAAAAAGCA AGATATGCCA TATAGCGTCA CAGTAGATGT 780 

TAATATTTAG ACGCTGTATT TTTTAAAATA AATGTGGAAC CGATACCATA TAACTATAAA 840 

TGGATAGGTT AAAAGTTAAA GAACGTAGGT AAAATTTGCT ATAATAGAAT ATAAATTGTT 900 

AACAGCATAA ATTATAAAAG GAGGACTGGG TAAATATTAT GACCGAATGG ACTAGAGAAG 960 

AACGTTATCA ACGAATCGAG GACGTTGATA CTGAGTATTT TAAAACATTA AAACAACAAG 1020 

TTGATCAATC AAAATTTCGT CAACAATTTC ATATACAACC AGAAACAGGC TTATTAAATG 1080 

20 ACCCCAACGG ACTTATTTTT TATAAAGGGA AGTATTATGT TTCACATCAA TGGTTCCCAT 1140 

TAGGCGCAGT ACATGGCTTA AAGTATTGGT ATAACTACAC GAGTGATGAC TTAATAAACT 1200 

TTAAAGCTGA AGGGCCAATT TTAAATCCAG ATACTAAATA TGACAGCCAT GGTGTATATA 1260 

GCGGTAGCGC TTTTGAATAT AACGGGCATT TATATTATAT GTACACAGGA AATCATCGAG 1320 

ATAATCATTG GCAACGACAT GCGAGTACAG ATGATCGCAC GATTGAAAGA AGACGGTTnC 1380 

AGTTGGnAAA A 1391 
(2) INFORMATION FOR SEQ ID NO: 225: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 930 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



25 



30 



35 



40 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 225: 

ATTTATTTTA ATGTTTATAT TTTCTAACAC TTTTTTATGA TCATAGTAGT AATTGACATT 60 

TTTCAATTCA AAGACTGGTG TCATCGTATc TCACCTCGCA TTCAACTATA CAACTCCTAG 120 

TAACATATGT AAACAGTAAT GTTTACGACT CAAAATTAGA CAAAATAAAG AGATATGCCC 180 

CCTTCAAGTT TTATTTATCG CATTTCTTGA AGAGAGCATT ATCATTTTAT TGTTGCATAA 240 

CCTTATTTTT TAATTCTGGG TCAAATTGCT GTTGTTTTAA CATTTCAATT TCAAGTTTAT 300 

ATGGCGGTTT TTTATTTTTC TTATCTTCAC CAACATAAGG TGTTTCTAAG ATTTTCGGAA 360 

TATCTTTAAA ACTATCATGA TGCACAATGT AATTTAATGC ATCAAAACCA ATGTAACCGA 420 
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GAACAACTTT GATTCTGTCG ACTCCAATGA TTTTATCAAA TTCATTTAAT ACGCCATCAA 540 

AGTCCTCTTT AACATTATAT CCAGCATCAT GCGTATGACA TGTATCAAAA CATACTGATA €00 

AACGTTCGTT ATTATGAACT CCATCAATAA TACGTGCTAA CTCTTCAAAT GAGCGACCAA 660 

TCTCTGTACC TTTACCTGCC ATCGTTTCAA GCGCAATACG TACATTATTG TCATTCGTTA 720 

AAACTTCATT TAATCCTTCA ATAATCTTAT TAATTCCGGC ATCAACACCA GCTCCAACAT 780 

GCGCACCTGG ATGTAATACa ATATCTTTAG CCCCTATAGC TTGCGTTCTk TCaATTTCTT 84 0 

GTTGCAAGAA ATCTACACCA AGATTAAACG TTTCTGGTTT GGTTGTAttG CAATaTTaAT 900 

GATGTATGGT GGCATGAACA ACAATATTAG 930 
(2) INFORMATION FOR SEQ ID NO: 226: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1984 base pairs 
20 (B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



• (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 226: 

TGACGCACCA ATTTATAACG CAATTGACAA AACAATTAGA TATACCTGTG AAATTTGTAC 60 

CTGGAAACCA TGATTTATGG GAAGTTGAAA GTATGACTAC GCAAGACATT TGGAATAATT 120 

30 

ATAAGAGTAT GTCACAGTGC TTGGTAGGAA AACCATTTAT AGTAAATGAA GAATGGGCAA 180 

TCATAGGACA TACTGGCTGG TATGATTATA GCTTTGCAGC ACAACGATTT TCATTAGATG 24 0 

35 AGTTACAAAA AGGAAAACAT TATGGTGCGA CTTGGCAAGA TAAAGAACGA ATATCTTGGG 300 

GCATATCAGA TCAAAATTTA TCTAAAATAG CGGCTGAACA AGTGAAGAAA GATATATTAG 360 

AAGTAGGAAA TAGACGAGTG ATTTTAGTCA CACATGTTGT GACGCACCCT GATTTCATTG 420 

40 TTCCTATGCC GCATCGTATA TTCGATTTTT ATAATGCATT TATTGGGACA AGTGATTTCA 4 80 

ATCCTTTGTA TGCGATGTTC GATATACCAT ATAGTATTAT GGGCCATGTT CATTTTCGTA 54 0 

AAAGTGTGAT AGATGATGGC AGATGTTATC TCTGTCCGTG TCTAGGCTAT CCAAGACAAT 600 

45 

GGCGTTCAGA AGATATTTAC CAGGAAATAA ATGAGACGAT ACAAATAATA GAAATTTAAA 660 

ATGCGCAAAC CTGACCCAGT TTGCGCATTT TATGTTTTAC ACACGCGAGT AATGTGTTTA 720 

CTTACGTGTG TTTATTTTGT TGCTGATTTT CAATTGTATA TGAATGTGGT TGCACATAAA 780 

50 

TGCACTTTCT TCCTGGTGAA TTAAAGCTGT ATTCCATTTT CTCTTTACGA ATTTTAATAA 84 0 

TTTGTTTGCG ATTTGGAATG ATGGCAGGTA AAACTAGGCC ACGACGAATA TGACTCCAAA 900 
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TTGAAACTTG TTTCGCTGGC TTGTTATCAA AGCGGAAAAC ACGTAGTAAT GGTTTAGAAC 1020 

CAAGATTAGT ATGGTATATT AACACAGGTT GACCTTGATC GATAATACCT TTAAGATCTT 1080 

CTAACGATTT ACCAGTGCCG TCTACGATAT TAGGATTGTA TTTTTGTAAA AATGGTACAT 1140 

ATGCTTCTGG AAATATGGTT TGATGATAAT TGCCAAGCTT AATGAATAAG TGATGTCCAA 1200 

CATAACCTTT ATGTGGATTG TTCGGATGTG TCGGCCAATG TCTCATAATT TCTGTAGCAG 1260 

GGATATGTTG GTTGTTGTAT TGCAACATCA TGGCTGCGGA AACACCTTCA CACCCCATGA 1320 

CCATAGGGAT AGGAAATAGC TGACTGATAG GTTTAACTGG TAATATTTTT CGGTTCATAA 1380 

TATAGTCCTC GCATTGATTC AATAAATATT TAATATAATT ATATAGCGTC AATGCAAAAT 1440 

GTCCTAAACA TATGTTTTAC ATGAGTGAAT AAAATTAATG GAGTGATAAA ATGGAATATC 1500 

AATTACAACA ACTTGCGTCG TTAACGTTAG TAGGTATTAA AGAAACGTAT GAAAATGGAC 1560 

20 GACAGGCTCA GCAACATATA GCAGGGTTTT GGCAAAGATG TTATCAAGAG GGAGTAATTG 1620 

CGGATTTACA GTTAAAAAAT AATGGTGATT TAGCCGGGAT ACTTGGCTTA TGTATACCTG 1680 

AATTAGACGG TAAGATGTCA TATATGATTG CAGTTACCGG AGATAATAGT GCTGATATTG 174 0 

AAAAATATGA TGTCATAACA TTAGCAAGTT CAAAGTATAT GGTATTTGAA GCACAGGGCG 1800 

CAGTACCTAA AGCAGTTCAA CAAAAAATGG AAGAGGTTCA TCACTACATA CATCAATATC 1860 

AAGCAGATAC GGTAAAATCA GCACCATTTT TTGAGTTGTA TCAGGATGGT GATACTACAA 1920 

j 

GTGGAAAATT AATATTACCA GAAATTTGGG ATnCCTGTTA AAGGGGTGAT TGAAATAnGA 1980 
AnTG 

(2) INFORMATION FOR SEQ ID NO: 227: 

35 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6373 base pairs 
~ (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
40 (D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 227: 

GATTCCACGT GTGTTAAAAG AAGTTACAcC TTCAATGATG GTATTTACTA ATTTCTTTAG 60 

AGATCAAATG GATCGCTTCG GTGAAATTGA TATTATGGTT AATAACATTG CAGAGACAAT 120 

TAGTAATAAA GGCATCAAAT TATTGCTAAA TGCTGATGAT CCATTTGTGA GTCGTTTGAA 180 

AATCGCAAGT GATACGATTG TGTACTATGG TATGAAAGCA CATGCCCATG AATTTGAACA 24 0 

AAGTACGATG AATGAAAGTA GATATTGTCC AAACTGTGGT CGCTTATTGC AATACGATTA 300 
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AAAATATGAA 

AAAATATGAT 

GTTTTAAGAG 

TCAGACAATG 

GCTAAAAATC 

AAAGTGTATG 

TATGATGCAG 

ACACGAGCAG 

GTTGAGCGTG 

GCAATACCAA 

GGAGGTCAAT 

TTTATACAGT 

TAAAGTTAAT 

TTTCTTTATC 

AATTAAGACA 

AGGCTATCAA 

AGGTATTTTA 

CGAAAGTGAT 

TGATTTCGGT 

AGAAGGCATT 

AAAfTACGAA 

TGAGCCTAAA 

AGCAAATAGA 

ATAAACGATG 

GAAACAACCA 

TCTATCCTAG 

AGGAATTTGA 

AAAACATCGA 

TATTTCGACA 



ATATCAAGTT 

ATGAAAATTG 

AGCTAGGGTT 

GTCGTATGCA 

CTGCAGGAAT 

TTATTTCGCT 

ATTTTGAAAA 

AAGAACTTCA 

ATATTTATAA 

ACTATACATC 

CATAATATGC 

GATATAGGAA 

GTCGTAGAAA 

GGTGGTGGAA 

CCACTTAAAG 

TTTTTAGGGA 

GATTTTTATA 

ACTTTTGGAA 

ACACTTGGTC 

CATTATAAAA 

ATCACTGATT 

GAAATAGATA 

CAGAAGAAAT 

AAGTTTAGTA 

AATTGATGTG 

AATTATCAAT 

CGATGAAGCC 

TAACATTTAT 

CTAGTGCAcT 



TTGATGTGGC 

CAGGTGACTT 

AAATGAACAA 

GTACTTTAAA 

GAATGCAAGT 

AAATGATAAC 

ATTATCTAAG 

ATTGCGATTG 

AGCAACGGCA 

ATTAGCGCCT 

ATGAATTGAC 

ATATTATTGC 

TCAATGAAAC 

GTGATAGAGA 

AAGCGATTGA 

AAAAATATAT 

CTGAATCAAA 

CTATTGTAGG 

ATGTTACTTT 

ATTTATTAGG 

ATCTGTTAGA 

ATGAAGCGGA 

CTCGTTAACT 

ATTAATCATA 

TGTTTTtTTG 

AGTAATGGTG 

TACTAAAGTG 

TTTAAAAGAT 

TTCGAAGATC 



ACCGTTTTTA 

TAACGCTTAT 

ACAATTAAAA 

AAAGAACGAA 

TTATCAGTTG 

GCTGCAGATG 

CAACAAATTG 

AAGTTAGCAG 

AAGACTATGG 

ATGCTTGAAC 

TATTTATCAT 

TTTAAGACAA 

AGAAGGTATT 

ACAAGCATTA 

AGATGGTATG 

CACGCCTGAT 

GACAAACCGA 

TTTTGAAAAT 

TGGTTATGGT 

TACTTATTTA 

AAAAGCTTGT 

AATACAAGCG 

CTGAACATCG 

TATGTATAAA 

TTCTAGTGAA 

ATTATGCAAC 

ATATTAAAAG 

GTAGTTATCG 

AAGAAGTTAA 



TATTTAAATA 

AACGCGTTAC 

ATGGCTTTGA 

AAGAAGCGAT 

GTGAACAATT 

GTCGAGATAC 

AAGCTATCAT 

AGGTTGAAGT 

ATTATAAAGG 

AATTAAACCG 

TTTATGTCAG 

CGTGCTAAAA 

ACCTTTGATG 

GCAACAAAAG 

CCGGGATTAA 

GGTACAGAAT 

TTAACAGGAG 

CACGGTGGTA 

AATAATGATG 

CATGGACCAA 

GAACGTAAGG 

AAACAAGTAT 

CATCAATGGA 

CACACACATT 

TAATTATTAT 

ATGAAAAAAT 

ATGCATCTTA 

AAGAAGATAA 

ATTTGAATTT 



TCAATGATGA 

AGCATATACT 

AACGTATACA 

GATCAATTTA 

AGAAGGCGAA 

TTCATGGATT 

CGTGACAGGT 

ACCAATTATA 

TTTCACAGTT 

TTCGTTTGAA 

ATAAATTGAA 

AACGAAATAT 

AATGTGATAT 

AATTAAGTAA 

CGATTTGTGG 

TAGAAGGGTT 

ATATTGTTAT 

GAACATATCA 

AAGATAAAAA 

TTTTACCTAA 

GTATTCCGTT 

TAATAGACAG 

TTTAATATTG 

ATTTTGGATG 

ACAATGAGTA 

GAATGATGAA 

TTTACATAGC 

TAAAATTTAT 

GCACTCTTTG 



420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
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TTATAGAACC TGATTTACAT TTTACAATTA TTGATTTTAA TCAAGAACTG CTTTGTATTT 2220 

ATATTGATTT TGATTCTGGT TTAAGGCATT CAAACATGGC AACAGAATCT GGTATTTCAT 2280 

TAAGGATAAA TGTTGCTAAA TCAGATTTTA CTAAATTTAT TAATGAATTA GCCTCTTTAC 2340 

ATTAATGATT TAAATCTGAT ATGTAATTAC AATCAAAAAA GACAGCCACA TCCCTCCGTA 2400 
GTTTAGGCGT GTGGCTATAT TTGAGTCTGA ATATTTATGC TTGTAATTTT AAAAAGGGAC „ 2460 

ATGCTATATA CGATAAAAAG AGGCGGGGAC ATAAATCAAT GTTCTATGCT CTACGAAGTT 2520 

ATATTGGCAG TAGTTGACTG AACGAAAATG CGCTTGTAAC AAGCTTTTTT CAATTCTAGT 2580 

CAGGGGCCCC AACAAAGAGA AATTGGATTC CCAATTTCTA CAGACAATGC AAGTTGGGGT 2640 

GTGGGCCCCA ACACAGAGAA TTTCGAAAAG AAATTCTACA GGCAAAGCGA GTTGGGGTGG 2700 

GACGACGAAA TAAATTTTAT GAAAATATCA TTTCTGTCCC ACTCCCATGG TGCCAATTAG 2760 

20 CATAAGGTAC TTAAATTAAG CATATCTGCT GTCTAGCAGT CGATAAATCA TTAGAACTTC 2820 

GTATAGTATA TGACTTTTAA TTTGATTTTC ACCACTAATT TCAAGTGCTT TTATAGTCGA 2880 

ACGTAAAGTT TCTACAGAAT CATCTTCTCT CTTAAAAGAA C CAT CAT AAA ATATATCTTT 2940 

GATGCTACTA CTAATTTTTA GCAATGCCAT TTTTTCGTCA CCTGAAAAGT TAACACGAGT 3000 

ATTTTTAGGC AAGTAAATGA TATTTGATAA ATGAGTGATA AACAAACGAT TCGTATATGC 3060 

ACGTTTAGTT AATTGATTGA GTAATTTCCA ATCACATTCT TTTTTCTTAT GATAGCTTAA 3120 

TTCATCACGT TGATAACTTA TTAACGTTTC AACTTGATTA TTTAAATTGA AAATATTTTT 3180 

ATATGCTTTT TCGCTTTTAT CAGATTGCAG TCTTGATAAG ATAAGTTCTT GGCAGCGATT 3240 

GTAAAATAAT TTATACATCA AGGCATCTGT CTTACTTAAT TTTTCTTCGA CCTGACCATA 3300 

ATACTTAGGT GGAAACACCA TGAAGTTAAT TAAACCTGAT GTCACGAGTC CAATAATTGC 3360 

TGTCAATGTT CGAGACAAAA AGTTGAATAT GTAGGCATCA TGAATACCTG GAATCATAGC 3420 

40 TAATGATGTT AGTACAGCGA CATTCGTACC AACTTGCAAT TTGAGTTTTG TACAGAATAA 3480 

AATCGTGAAC GTTGCACTCA ATGCATATGT AAAAGGTGAT TGATCGCCGA ATAAATATGT 3540 

AAATAATACT GCAAAGCCTG CACCAATTAC CGTAGCAGGT AATCTACGAT AACCTTTAAT 3600 

AAGTGATGCC TTGGCAGTTG GTTCAATTGT GACTACAGCT GTTAAAATGG CATAGATGGG 3660 

TGTTAAATCT AGTGCCATAC AAAAGACAGC TGTTAAAAAA ATGGCAATAC CAGTTTTAAT 3720 

TGTTCTGGCA CCAATTAAAT GTTTATACCA TTGATCGTTC ATTTTTTAAC CTCTAATCAT 3780 

CGTAAAATCT TAGCGAGCGC TTTATAATAA TAGTATCGTA CATTGGAAAA GTTCATGTAT 3840 

GTAAAATATT TGAAATAATC ATACATAAGC ATTACTTTGA TTTTCATATA CATTAATCAA 3900 
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CAAGCATTTT TCAATTATAG TCCGGGGCCC CAACATAGAG AATTTCAAAA AAGAAATTCT 4020 

ACAGGCAATG CAGGTTGGCG GGGCCCCAAC ACAGAAGCTG ACGAAAAGTC AGCTTACgAT 4080 

AATGTGCAGG TTGGCGGGGC CCCAACATAG AGAAATTGGA TCTACAATTT CTACAGGCAA .4140 

TGCAAGTTGG GGTACAACGA TAAAGAAATA TTTTTTCTTT ATCACACTAT GTCTCACTCA 4200 

CTTTCCAAAA TACTAAAGTA ACATCTTTAG TATATCAAAG AATTTTTGCT ATAATAAGTT 4260 

ATAATTATAT AAAAAAGGAA CGGGATAAAA TGATTGTAAA AACAGAAGAA GAATTACAAG 4320 

CGTTAAAAGA AATTGGATAC ATATGCGCTA AAGTGCGCAA TACAATGCAA GCTGCAACCA 4380 

AACCAGGTAT CACTACGAAA GAGCTTGATA ATATTGCGAA AGAGTTATTT GAAGAATACG 4440 

GTGCTATTTC TGCGCCAATT CATGATGAAA ATTTTCCTGG TCAAACGTGT ATTAGTGTCA 4500 

ATGAAGAGGT GGCACATGGG ATTCCAAGTA AGCGTGTCAT TCGTGAAGGA GATTTAGTAA 4560 

ATATTGATGT ATCGGCTTTG AAGAATGGCT ATTATGCAGA TACAGGCATT TCATTTGTCG 4620 

TTGGAGAATC AGATGATCCA ATGAAACAAA AAGTATGTGA CGTAGCAACG ATGGCATTTG 4680 

AGAATGCAAT TGCAAAAGTA AAACCGGGTA CTAAGTTAAG TAACATTGGT AAAGCGGTGC 4 74 0 

ATAATACAGC TAGACAAAAT GATTTGAAAG TCATTAAAAA CTTAACAGGT CATGGTGTTG 4 800 

GTTTATCATT ACATGAAGCA CCAGCACATG TACTTAATTA CTTTGATCCA AAAGACAAAA 4860 

CATTATTAAC TGAAGGTATG GTATTAGCTA TTGAACCGTT TATCTCATCA AATGCATCAT 4 920 

TTGTTACAGA AGGTAAAAAT GAATGGGCTT TTGAAACGAG CGATAAAAGT TTTGTTGCTC 4 980 

AAATTGAGCA TACGGTTATC GTGACTAAGG ATGGTCCGAT TTTAACGACA AAGATTGAAG 5040 

AAGAATAGTT CAACATATAC TAAGACTAAA GTATGAACAT CATTTAGTTC CGGAGCCTAT 5100 

TCATATTGGT TTCGGAACTG TTTTATAATA ATTAAGAACA CAATCAATGC GTCATTTCAA 5160 

AAATATGTTG TAACAAAGTA GTTTTTAAGC AAACATATCA TCGACATCAA CGAAGATACA 5220 

40 TAGCGCATTT GGTATTTTAA AACTTATTAT AAAAGGTGAT AGTTATGAAC TATGTTGAAC 5280 
. GTTATATTGA ACAGTTTTTG AGAGCAACAG TAAGAAATAA TATCAAGCAC TACCTTTTAA - 5340 

TGCTAGATGA AAAAATGAAA AATTTAGATG ATTATATGCG TTATTTAATT ACTAAAAAAG 54 00 

AACAACTTAG CAAGTTAATT GACAGTCTAA TGCTAACATT AGAAAATAAA TATATTGATA 54 60 

TTGCTGAAGC ATTTCAAATT CAATGTGCAA GAGAAATCAA TAATCAAGAA ATTGAAAATA 5520 

TTAAATCAGA GTTGAATAAA GTTGAAGCAT ATTATGCACA AATTGAAACT CAAATTCAAC 5580 

AAACTTCAAC TGAAAAAATA GCAACAGAAA AAACATCGTA TCTAATAAAT TATATGAACG 564 0 

CTGTGGCATA GAAAGGCGGC GAAACATGAC ACACAAATAT ATATCAACGC AAATGTTGAT 5700 

55 



25 



30 



35 



45 



50 



995 



EP0 786 519 A2 



CTTTTTACTC GTTCTATTAT TGGGATGTGT ATTAGTTTAT GTAGGATATC TTTATTTTCA 5820 

TAAAATACGT GGCCTTTTGG CGTTTTGGAT AGGCGCGCTA TTAATTGCAT TCACATTATT 5880 

GTCTAATAAG TATACAATCA TCATCTTGTT CGTCTTTTTA TTATTACTTA TTGTGCGTTA 5940 

TTTAATACAC AAGTTTAAAC CAAAAAAAGT AGTTGCGACG GATGAGGTTA TGACTTCACC 6000 

ATCTTTTATT AAACAAAAGT GGTTTGGTGA GCAACGTACA CCAGTTTATG TATATAAGTG 6060 

GGAAGATGTA CAAATTCAAC ATGGAATTGG CGACCTACAT ATTGACTTAA CAAAAGCTGC 6120 

AAATATTAAG GAAAATAATA CCATTGTTGT TAGACACATT TTAGGTAAAG TGCAGGTTAT 6180 

ATTGCCGGTT AATTACAATA TTAATTTACA TGTAGCTGCT TTTTATGGAA GTACTTACGT 6240 
GAATGAAAAA TCATATAAAG TTGAAAATAA CAATATTCAT ATTGAAGAAA TGATGAAACC . 6300 

GGATAACTAT ACAGTTAATA TCTACGTATC AACGTTTATC GGAGACGTAG AGGTGATTyA 6360 

20 TCGATGAAyC ACT 6373 

C2) INFORMATION FOR SEQ ID NO: 228: 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4488 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 228: 

ATAGnGAAAG CGTTTTACAC TTAATAACTC CCTCTTAAAT GCATCCAGGT TCTATGTAGT . 60 

AAATCATGAA nATAACATAT AAATnTAGAG GAGATTTACC TTTGAATACA GAGAACAACA 120 

AGAATCAAAA CCAATCTGTT AAAAATTCTG AAAGaCGCGG CATGTTAAAA GGATGCGGCG 180 

GTTGCCTTAT TTCTTTTATT TTATTAATAA TCTTATTATC AGCCTGTTCA ATGATGTTTA 240 

40 GTAATAATGA CAATTCCACT AATAATCAAT CATCAAAAAC GCAATTAACT CAAAAAGATG 300 

AAAATAAAAA TGAAGATAAG CCTGAGGAAA AATCAGAAAC AGCAACAGAT GAGGATTTAC 360 

AATCAACCGA AGAAGTACCT GCAAATGAAA ATACTGAAAA TAATCAACAT GAAATTGATG 420 

AAATAACAAC AAAAGATCAA TCAGACGATG ATATTAACAC ACCAAACGTT GCAGAAGATA 480 

AATCACAAGA CGACTTGAAA GATGATTTAA AAGAAAAGCA ACAATCAAGT AACCATCATC 540 

AATCCACGCA ACCTAAGACC TCACCATCAA CTGAAACAAA CACGCAACAA TCATTTGCTA 600 

ATTGTAAGCA ACTTAGACAA GTATATCCGA ATGGTGTCAC TGCCGATCAT CCAGCATATC 660 

GACCACATTT AGATAGAGAT AAAGATAAAC GTGCATGTGA ACCTGATAAA TATTAAACAA 720 

55 



996 



EP0 786 519 A2 





(jCsCjAUAI ill TTAGGCATGA 


GCAATCAATT 


CAAAAGCGAA 


GAAGAGCGAA 


GACAATGGGA 


840 




HPJ ft'PT'fT'ft ft. PpffPTPPR K 74 

Al-AAJ. 1 LLAA GCTTTCCAAA 


ATCAACAAAA 


CCAACAGAAC 


CAGCAATACG 


GACAAAAGAA 


900 


5 


ATCTAAAAAA GGATGGTTCT 


GGGGCTGTGG 


TGGTTGTCTA 


GTATTATTTA 


TTTTAATTAT 


960 




LA TCGG 1 A 1 r TCAGCTTGTA 


CAGCTGGTAT 


TACAGGTAAC 


CTTGGCGGAA 


ATAGTTCTAA 


1020 


10 


ft f*7i ft ft ft ft ^ ft ft ft r*r*r*T\ 
A(j AAALCjAA L AAAACCCATA 


AAATCGGTGa 


AACTGTTAAA AATGGCGACC 


TTGAAGTCAC 


1080 


TG TAAATT CA GTGGAAACTA 


TGAAATCTGT 


AGGACCATCT 


CTTGCACCAA 


CAAACGCTAA 


1140 




AGG T ATATTT GTCGTTG CTG 


ATGTGACGAT 


TAAAAACAAA 


GGTAAAGAAG 


CGTTAACAAT 


1200 


15 


TGATAGTTCA ATGTTTAAGC 


TAAAATCCGG 


TGATAAAACA 


TTTGAAGCAG 


ATAATACAGG 


1260 




TTCAATGTCT GCTAATCAAA 


GTGACAATGG 


TAGTATAGAA 


AATTCATTTT 


TCTTACAGCG 


1320 




TATAAATCCA GATAGCACTG 


CTCAAGGTAA 


AATTGTTTcG 


ATGTGTCAGA AAACATAGCC 


1380 


20 


AACGCAAAaG ATAAAAAATT 


AGAAGTTATT 


TCTAGTTTAT 


TTAGCGTCAA 


GAAGATTACA 


1440 




TTTGATTTAT CCGATGCTAA AAAAACATCA 


AaAGCTaaaA 


AAGACAAGCA 


AGATACAGAA 


1500 




GTAGCTGTTG CGAGTTCAAA 


TAGCGATAAT 


GTAAGTTATG 


AAGCTTCGGC 


TACTACACCT 


1560 


25 


GCTACAACTT CTAGTGCGGA 


TACTGATTCT 


GAAGATAGCG 


AAAAGTCTAG 


TAAAGATGAG 


1620 




GATAAGCAGA ATGCGTCTAA AAgTGATAAA TCTAGTGTAG AAAAAAGTGA ATCTAATGAG 


1680 


30 


GAAACTGCTC CTGTAGAGCC 


CATGCCCCAT 


AGCAAACCTA 


CCACTAGTGA 


aGCACCACCT 


1740 


AGCCAAAATA TTCACAaTGa 


AGATAGCmTG 


TACGACGCTT 


CAACAGAATA AAATtnyCAG 


1800 




tAGCTCGGCT ACCCTTCTTT 


TACGGAAAAA 


TTAATTATAC 


ATAATCaAAT 


CaAGGAGATA 


1860 


35 


AAAAAATGAA ATTCAAAGCT 


ATCGTTGCAA 


TCACATTATC 


aTTGTCACTA 


TTAACTGCCT 


1920 




GTGGTGCTAA TCAACATAAA 


GAAAATAGTA 


GTAAATCAAA 


TGACACTAAT 


AAAAAGACGC 


19B0 




AACAAACTGA CAACACTACA 


CAGTCAAATA 


CAGAAAAGCA 


AATGACACCA 


CAAGAAGCCG 


2040 


40 


AAGATATAGT TCGAAACGAT 


TACAAAGCAA 


GAGGCGTTAA 


TGAATATCAA ACATTAAATT 


2100 




ATAAAACAAA TCTTGAACGA AGCAATGAAC 


ATGAATATTA 


TGTTGAACAT 


CTAGTCCGCG 


2160 




ATGCAGTTGG CACACCATTA AAACGTTGTG CTATTGTTAA TCGACACAAT GGCACAATTA 


2220 


45 


TTAATATTTT TGATGATATG 


TCAGAAAAAG 


ACAAAGAAGA 


ATTTGAAGCA 


TTTAAAAAGA 


2280 




GAAGCCCTAA ATACAATCCA 


GGTATGAACA 


ATCATGATGA 


AACAGATGGT 


GAGTCAGAAG 


2340 


50 


ACATTCAACA TCATGACATT 


GATAATAACA 


AAGCAATTCA 


AAATGACATA 


CCAGATCAAA 


2400 


AAGTCGACGA TAAAAATGAT 


AAAAATGCTG 


TTAATAAAGA 


AGAAAAACAT 


GATAATGGGG 


2460 




CAAATAATTC TGAAGAAACT 


AAAGTTAAAT 


AATGGCATAC 


TTTGATTAAT 


CGTAATTTTT 


2520 
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ACTATGCATG GTCTTTTTAA TCAACTTAAA CTCGGCATTA TTTCAATCGA AAACGCAGAG 2640 

CATACGCTTT TTACACCTTA TATGTTGGAA ACGCTCTCTT CCCTAGGCGT GAAAGACAGC 2700 

ATTGTCGATT TAATTCATAA AGGGACTGAA TTAGAAGACT TTGCGGCATT TAATTTATCA 2760 

ATTGAAGACA CAGTTACAGT CTGTTTACAA AGAACTGAAG AACTATTAAA ACAATACAAA 2820 

AATGTGGAAT TCAATGACAA AATATTAATC AATTGGCGTA TTATACAAGA GAAATAGACA 2880 

TATAAAAGTC GAATGTAACt ACGTGAGTAT TGATTTTATT CTTTGTAAAT TACAAGCATT 2940 

TCATATTATA AAGTTTGAAA AGAGGTATAT TGAAATGGAG AAAAATGAAT ATATAGCTAA 3000 

1S ATATAATGAA TATAGTCAAT TATTAGACGC TACATACTCG CAAGCTGTAG CATmCCTTTT 3060 

AAGtAAATaT GGCGCTGTAA CCGATGATTA TTATAAAGaA AAATCATACA CGCGATTTTT 3120 

AAAtGGAGnA ATCAAAAGTA TTTCAAAAGG AAAATACACT AGAGCTAGCG AaGGATTATA 3180 

20 TTGCCATCAT ATAAGCGAGG ACAAATTCCA AAATCTATCT GATCTAAGAT TCATtTCCAA 3240 

ATTTAAGTAC TCATACGACG TTCAAAAGAA AGAAAACTTA GTGTACTGTG ATCTAATCGA 3300 

GCATTTAATT TTACATGCAA TTATTACAAA AGAATCCCAT GGCCAATTTG GTGTAGCTGG 3360 

ATTATGTCAA ATGATCAAAC CAACAGTCAT TGATTGGTAC ATTGGCGAAT ATAATCCAAA 34 20 

ACCAGCATGG ATGCAAGCCA CCAAAGCACG TGCCTATTTG CCTGGAATAT TAGTAGAGAA 3480 

ATTACTCATT AAAATTGACG ATATGTTAAA AGGAATAGAA ATATAAGATT TCCTTGAGTC 3540 

TAGATAAATG ATTAATGTAG ATTTATTTTT TGCTGTTGAG ATTTTGTTAT AGATGTTTAA 3600 

ACCTGTAATT AAATATATTT TATAAAATAG ACCACGCATA CCTATCTATA AACGGrCAAT 3660 

35 GTTTATAAAT GAGTTTGCAT GGtCTTGAAT TGTATTAAAT TTCTTTTGGT TTTAATAAAT 3720 

CGACTAGATT TTCACAATAT TTATCAAATA TGTATTCCTA AATTATACAG CCTTAATCCA 3780 

GCACCTACTT TCGAAACTTC CAACTTAGTT GATATAAGGT TCAATAGTTT GTTTCGTTCT 3840 

40 TTTTCAGATA AACCAGAACT TAAATTGATA TTATTGACTT CATAAAAATT ATAGACTAAT 3900 

GCCTCTATTT GCTTTTTAGG CATAAGTAAG TCGACTGAAA ACTGATTTAC GTCGCTTTCA 3 960 

TAAATCATTT CATGTAAATT CTTTAGACTA TTATCGTTAC TATCTCTCAT TAAGTCTGTA '4020 

45 

TTTTTAAATA AATAACGGCC CAATTCACGA GCTATTGAAA ATCTTGTATT ATTAATCGAG 4080 

TGATTATTAT TAATATAGAT TGTTCTTCCA CTTAAATAAC CCGAAGTATT ACCCTCCATT 4140 

v TTAATATATC TAACATTTAA ATTAAGTTGA AATAATAGCT TGTCTATGTC AATAGCAAAG 4200 

50 

TGTTCAGAAG TAATAAAAAG TTGATCCATT TTGTCCTTTA TAAATGCCTG AAATAATCGA 4260 

ACTATTTTTG ATTCTAAAAT ATCTTCATAA TGAACTTTCT CAATAACTTT CAATTGATTC 4320 

55 
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AACATTATTA AAATAAAACC CCTCTACTAC TATATGTAAC GAAGGGACAT GATTTCAAAA 4440 

TAAAATACCT TTTTTATAAA TnTATTATAA TATCCCCCAC TATACnAC 44 88 
5 (2) INFORMATION FOR SEQ ID NO: 229: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 846 base pairs 

(B) TYPE: nucleic acid 

10 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

15 (Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 229: 

TATGGCGCCA TATTAGTTGT AACTGGTTTA AGAGGTCcAa GAAaTATCaA ATAAAGTTGT 60 

tCCTGGGCTT GGTACTGTTA TCTCaATATT GmwTGCaTTT GGTGGTCTAG CTTTTAATAT 120 

20 TGGTAATATT GCTGGTGCCG GTTTAGGTTT AAATGCAATT TTTGGATTAG ATGTAAAATG 180 

GGGCGCAGCT ATTACTGCAA TCTTTGCAAT ATTAATCTTT GTAAGTAAAA GTGGCCAAAA 240 

AATTATGGAC GTTGTTTCAA TGATTCTTGG TATTGTGATG ATTTTAGTTG TGGCATATGT 300 

25 GATGTTTGTT TCTAATCCAC CTTATGGTGA TGCTTTTGTG CATACATTTG CGCCAGAACA 360 

TCCAATGAAA TTAGTCTTGC CCATCATTAC GTTAGTTGGT GGAAcTGTar GTGGTTATAT 420 

TACCTTTGCA GGTGCACATC GTATATTAGA CTCTGGCATT AAAGGTAAGC AATATTTACC 480 

30 

ATTTGTAAAT CAATCAGCAA TTGCTGGTAT TTTAACTACA GGTATTATGA GAACGTTACT 54 0 

ATTCCTAGCG GTATTAGGAG TTGTTGTAAC AGGTGTGACA CTAAGTTCTG AAAATCCACC 600 

35 AGCGTCAGTT TTTGAACACG CAATTGGACC AATTGGAAAG AATATTTTTG GTATTGTGTT 660 

ATTTGCTGCA GCTATGTCAT CAGTAATTGG CTCAGCATAC ACAAGCGCAA CATTTTTAAA 720 

AACACTTCAT AAATCACTTA ACGAAAGAAG TAATTTAATT GTGATTGTGT TTATCGTTAT 780 

40 TTCAACAATG ATTTTCTTAT TTATTGGAAA ACCAATCAGC CTTTTAATTA TAGCAGGCGC 84 0 

GATAAA 84 g 
(2) INFORMATION FOR SEQ ID NO: 230; 

(l) SEQUENCE CHARACTERISTICS: 

(A) length : 2072 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
<D) TOPOLOGY: linear 

SO 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 230: 
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TCTTTTTAAA AGGTACTAAT ATTTCTTTAG TGAAAATTGA ATCACGGTCG TTTATTGGTG 120 

CCTTGAGTAT ATTATTATAG ACGGAATCTG ATCTAATAAT ATTGATTTTA TACATGATAA 180 

5 

ACCTCCTTAT GTTGTCAGCA TAAAGGATAA CGTAACGTGA TTTTCAAGCA GTAATTGTAA 240 

CTAATTGAmA AAAATTAAGA AAAGTATGTG AGTGTTCCTA AwTAATATGa TTAAAATGAT 300 

GGCGAATAAG TGTCTaAAAG CATCTTAAAG GGACATTGTA TAGGGTAAAT CACTTCATAA 360 

10 

ATAAGGGaAA ATCCTTATGT TCACTTTTTC ACAATCATnA TAAAATATAT ATGTAGTCAA 420 

TACTTTGTCT ATATTGAATG TTTTCATATA AATGAAAGCA TTTTTAAATA ACATTGACCT 4 80 

1S CTAATATATA GGCAGAGTAT TGATATCTAT TAAAAAATAA ATGATTTTGA TGAAGGTGAA 540 

ACGTATGTAC AAAACAAAAG GTGGCTTTCA ACTTACATTA CAAACATTAA GTTTAGTGGT 600 

TGGGTTTATG GCTTGGAGTA TAATTGCGCC ATTAATGCCC TTTATTAAAC AAGATGTCAA 660 

20 TGTTACTGAA GGTCAAATAT CAATCATTTT AGCGATACCA GTTATTTTGG GATCGGTGCT 720 

CCGTGTGCCA TTTGGTTATT TAACAAACAT TGTTGGCGCT AAATGGGTAT TCTTTACTAG 780 

TTTTATCGTA TTGTTATTCC CGATATTTTT CTTAAGCCAA GCACAAACAC CGGGTATGTT 840 

25 

AATGGCTTCA GGATTTTTCC TTGGTGTAGG TGGTGCAATT TTCTCAGTTG GTGTTACATC 900 

AGTTCCTAAA TATTTCCCTA AAGAAAAAGT AGGTCTAGCA AATGGTATTT ATGGTATGGG 960 

AAATATCGGT ACAGCAGTTT CTTCATTTTT AGCACCACCG ATAGCGGGTA TTATTGGTTG 1020 

30 

GCAAACAACA GTTAGAAGTT ACTTAATTAT TATCGCTTTA TTTGCATTAA TTATGTTCAT 1080 

TTTTGGTGAC ACACAAGAAC GTAAAATTAA AGTACCATTA ATGGCtCAAA TGAAAmCATT 1140 

35 ATCTAAAAAC TACAAATTAT ATTACTTAAG TTATTGGTAT TTTATTACTT TTGGTGCTTT 1200 

TGTAGCATTT GGTATTTTCT TACCTAACTA CTTAGTAAAT CATTTTGGAA TTGACAAAGT 1260 

AGATSCTGGT ATTCGATCAG GTGTATTCAT TGCGCTGGCA ACATTCTTAA GACCAATAGG 1320 

40 TGGCATTTTA GGTGATAAAT TTAATGCAGT TAAAGTATTG ATGATTGATT TTGTTGTTAT 13 80 

GATTATCGGT GCCATTATTT TAGGTATTTC AGACCATATC GCATTATTCA CTGTAGGCTG 1440 

TTTAACAATA AGTATTTGTG CAGGTATTGG TAACGGCTTA ATCTTCAAAT TAGTACCATC 1500 

45 

ATACTTCTTA AATGAAGCGG GATCCGCAAA TGGTATCGTA TCAATGATGG GTGGTTTAGG 1560 

AGGATTCTTC CCACCACTAG TAATCACGTA CGTAGCTAAT TTAACAGGAT CAAGTCATTT 1620 

AGCATTTATT TTCTTAGCGG TATTnGGAnG TATTGCATTA TTTACCATGC GTCATTTATA 1680 

50 

CCAAAAAGAA TATGGCTCAT TGAAaAACGG TTGATATGTA ATACATGCCA TTcATTTAGT 174 0 

TAAATACAAA GCCTTaATAT CATGCGCAAT ATTCGTAGCA TGACATTAAG GCTTTAGTAG 1800 

55 



1000 



EP0 786 519 A2 



CTTGGTTTGA TTTTAGGCAA GGTAATGGTT AATAACCCAT TTTCAAAACT AGCAGTAATA 1920 
TGTTGCTTAT CAACAGCTTC AAAATCAAAT TGACGCATTA ATGATTCGAA GTTACGCTCA 19 80 

5 

TCTAAAATGA GTTGTTCAGA TTTGTATTTT GCGCTTCTAG TAGCTTGAAT AGTGAGCGwA 2040 
TTAt t ATTGA AATCgATACT AATAtCTccC TG 2072 
(2) INFORMATION FOR SEQ ID NO: 231: 

10 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3159 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
t c (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 231: 



25 



35 



40 



50 



CGTCTTCTCT TGGTTATTCT 


CTGTGTTTTG 


TCTTTGTTCA 


AATTCGATTT 


TTTGTTGTTC 


60 


GAATGAATGT 


AATACTTTAT 


TTTTTTTTGG 


CACATAATCC 


AAGTnATTTT 


TAGGAATTAA 


120 


TATACGGTCT 


TTAAATGCTT 


CTTGTATTTT 


GCTCACAATC AATTGGTATA 


GTTGCTCTTC 


180 


TTTTGATAAA 


CGCACTTCTA 


GTTTTGTTGG 


ATGAACATTT 


ACGTCTACTA 


AGATTGGATC 


240 


CATTTCAATA 


TTAATATAAC 


AAATCGGGAA 


CCTACCTATT 


GTTAAGAGTG 


TATGATAGCC 


300 


TTCTAAAATC 


GCTTTATTTA 


GCATAAAGTT 


TTTAATGTAT 


CGTCCATTAA 


TAAAAATAGA 


360 


AATATAGTGC 


TTATTACTTC 


TAGAATGTTC 


AGGCTTTGCA 


ACAAAACCTT 


CAATGTGATA 


420 


ATCACTTGTA 


TCTCCAGATA 


TATGTACTAA ATCTCGTGCA ACTTTCATCC CATAAATCTC 


480 


TGCCATCACT 


TCATTAGTTC 


GTCCTGAACC 


ATTTGTACTT 


AACATTGTTT 


TGCCATCTGA 


540 


AATGAGTGCT ATTCGAATGT 


CCGGATGGCT 


CATTGCCATT 


CTGTTGACAA 


TATCTGTTAT 


600 


TTTACCTAGT 


TCAGTGTATA 


AACTTTTAAT 


ATATTTTAAA 


CGTGCTGGTG 


TATTATAAAA 


660 


TAATGATTCT ACAAGTATAT 


CTGTTCCTTT 


TTTCGCTTTT 


GCAGGCTTAT 


GATTTAATAT 


720 


TTCACCATTT 


TCTACATATA 


TTTCATTTCC 


ATTAGCATTA 


TCCGTGCAAG 


TCTTCAATGT 


780 


TACTTTAGCA ACTGATGAAA 


TACTGGCTAG 


TGCTTCACCA 


CGGAATCCTA 


ATGTCCTAAT 


840 


ATGAAATAAA 


TCTTCATCTT 


GATCTAATTT 


ACTAGTCGCA 


TGTCTATGAA 


ATACTAATCC 


900 


TAAGTCTTCC 


GCTTCAATTC 


CGCTTCCATT 


ATCGACTACG 


CGAATAGATT 


GGACGCCAGA 


960 


tTCCTCTACT 


TCAATGCTTA 


TTTCTGTAGC 


GCCTGCATCT 


ATAGCATTTT 


CCAACAGTTC 


1020 


TTTCACAACA 


GAACTCGGTC 


TTTCAACTAC 


TTCACCTGCT 


GCGATTTTAT 


TTGCTAATGA 


1080 


GGTTTGGAGT 


TCTTTAATTT 


TCCCCATTTT 


GCAACACCTC 


TATTTTAATT 


GATTTTGTAA 


1140 
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TTGTAGTTCA ATCTCGCTTT TTTGATCATT TTCAAACAAA TcAAATGATG CyTGTTCAAA 1260 

GTCTTTTTGA GATAAAGTAT CaGTTGTTTC TTCaACACTT aAGTTTAAAT TTTCTTGATT- 1320 

5 AATTTCCAGG TTCATTTTCG ACCATTTTTA AATTTGATAT CGATGATtTT TCACCAGCAG 1380 

ACGCTTCAAA CTCGCTTAGA ATCACTTGTG CTCTGCTAAT AACTTTTTCA GGTAAATCAG 144 0 

CTAATTTCGC AACTTGAATA CCATAAtATC GTCAACTGCA CCATCTTTGA CTTTATGCAA 1500 

10 

GAATATAAGT TCACCTTTAT ATTCATTAGC AGCGACGTGA ACATTTTTTA GACTTGGTAA 1560 

TGCTTGATCT AATGTTGTCA ATTCATGATA ATGTGTTGAA AATAACGTTT TAGCATGTGA 1620 

75 TGTTTCAGCT ACATACTCTA TCATTGCCTG CGCTAAAGCT AAACCGTCAT ACGTTGAAGT 1680 

ACCACGTCCA ATTTCATCGA AAATAATCAA ACTATCCTCT GTTGCATAAG TTAATGCCTT 1740 

TTGTGCTTCT AGCATTTCTA CCATAAACGT ACTCTTACCT GAAACCAAAT CATCTGCCGC 1800 

20 ACCTATTCTA GTGAATATTT GATCAAATAT AGGTAACACT GCCTCTTTAC AAGGGACATA 1860 

AGCTCCCATT TGGGCCATTA TACTAATTAT GGCAACTTGT CTCATATATG TCGATTTACC 1920 

AGACATATTC GGACCTGTAA TTAAATATAT AAATGTTTCA TTATCTAATC GACAATTATT 1980 

25 

AGGCACATAG TCATTATAAT CCATTACTCT TTCCACTACT GGGTGCCTAG ATTCCACTAA 204 0 

TTCTAATGTT TTATTTTCAC TAAATGAAGG CCTAGTGTAA TTATATTTTT GAGCAATTTC 2100 

TGCAAAGCTC TGTAAACAAT CTAGCTCTGA AATAATTTTA GCTTGTTGTT GTAAACGTTC 2160 

30 

AGTATATTTT TTAACTTCTT CACGTAGCTG AACAAATAAT TGATATTCTA ATTCGATGGC 2220 

TTTGTCTTCC GCACCTAAAA TGATATCTTC TTTTTCTTTA AGTTCATCAG TTATAAAACG 2280 

35 TTCAGCATTC GATAACGTTT GCTTCCTCAT ATAACCAAAT TCACTTGGTT CAAAATTTTG 2340 

CAAGTTGGCA CGTGTTATTT CTATAAAATA ACCAAACACT TTATTAAAGC TTATTTTCAA 24 00 

TGATTTTATT CCTGTACGTT GTCTTTCTTT GGCTTGTAAT TCTGCTAACC ATGTTTTTCC 24 60 

40 GTTTTTTGAA GCTTCAAGAT ATTCATCTAA TTGCGTATTA AAACCAACTT TGAATAGTCC 2520 

GCCATCTTTA ACTGAAATTG GTGGTTCTTC TACTAAACTC TGTTCTAATA TATCAAGTAA 2580 

ATCATCaAGG GGTTCTAGTT GATTAACTTG TACAAGAGTA TTCTGATTCA TAGAATTTAG 2640 

45 

TAATGCTTTA ATATTCGGTA TTTCAGAAAT GGAATGTTTA AGTTGAATTA AATCTCTCGC 2700 

ATTAACATTT CCGTAACTAA CACGCCCAAC AAGACGTTCA ATATCATACA CTTGATTAAG 2760 

ATATGTTCTT AAGGTGTCTC TTTCTATGAA ATGAGCACTA AATTCATCAA CGATATCTAA 2820 

50 

TCGTGCTTCA ATTTGTTCTT TACTTATTAG TGGTCTATCT ATCCATTGTT TTAAGCGGCG 2880 

TGCTCCCATT GGTGTTTTCG TTTCGTCCAT TAGCCAAAGT AGCGTTCCTT TTTTTGATTT 2940 
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ATCTATAGCT GCATATTGAA CAACATCCTC GATATGCGAT AAATCACGTT TTTGTGTATG 3060 

ATGAATATAA TCTAGCAATA ATTGTGTCGC TTGATACaTT AATTTATGTT CAGTTTGATT 3120 

5 CACACTATAG ATTtCTGATG ATAACGTTTC CCTGACTGT 3159 

(2) INFORMATION FOR SEQ ID NO: 232: 

(i) SEQUENCE CHARACTERISTICS: 
70 (A) LENGTH: 1238 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

15 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 232: 

TAAGCGAGAA GCAATTGGTG TTATGTATGC TAGTGATAAA CCAACAGGTG AAAGTACAAG 60 

20 GTCATTTGCT GTTTATTTCT CTCCTGAAAT TAAGAAATTT ATTGCAGATA ATTTAGATAA 120 

ATAAATCATC CATCCATACA TTGATAAATG ATTTTyAGAA ATTAACAACA AAATCAACAA 180 

TTTTAAACAT CTCTGTGATT CTATTTATTC GAAATGATTT AAAAAATAAA ACTTCAAAAA 240 

CCTAACCTTA TATTTATACG AATACTTAGA GGAGCACAAA AATGAATAAA AATATAATCA 300 

TCAAAAGTAT TGCAGCATTG ACGATTTTAA CATCAGTGAC TGGCGTCGGC ACAACAGTGG 360 

TTGAGGGTAT TCAACAAACG GCTAAAGCTG AACATAATGT GAAACTAATC AAAAATACTA 420 

ATGTAGCACC ATACAATGGT GTCGTTTCGA TAGGATCTGG AACAGGTTTC ATTGTCGGTA 4 80 

AAAATACAAT TGTTACCAAC AAGCATGTCG TTGCAGGTAT GGAAATTGGT GCACATATTA 54 0 

TAGCGCATCC CAATGGTGAA TATAATAATG GCGGATTTTA TAAAGTTAAA AAAATTGTCC 600 

GTTATTCAGG TCAAGAAGAT ATTGCCATTC TACATGTGGA AGATAAAGCT GTTCATCCAA 660 

AAAACAGGAA TTTTAAAGAT TACACAGGCA TTTTAAAAAT AGCATCAGAA GCTAAAGAAA 720 

40 ATGAACGCAT TTCAATTGTT GGCTATCCAG AACCATATAT AAATAAATTT CAAATGTATG 780 

AGTCAACAGG AAAAGTGCTG TCAGTTAAAG GCAACATGAT TATTACTGAT GCTTTCGTAG 84 0 

AACCAGGCAA CTCAGGTTCA GCTGTATTTA ACAGTAAATA CGAaGTtGTA GGTGTTCACT 900 

TTGGTGGAAA CGGCCCTGGA AATAAAAGTA CAAAAGGATA TGGTGTTTAT TTCTCTCCTG 960 

AAATTAAGAA ATTCATTGCA GATAACACAG ATAAATAAAT CCTTACATAG ATAAATGATT 1020 

TTAAAAATTA ACAACAAACT CAACaATTCA AATCATCTCT GTGATTCCAT TTATTCGAAA 1080 

TGATTAAAAA AAATAAAACT TCAAAAAGCT AACATTATAA TTATACAAAT ACTTAGAGGA 1140 

GCAGAAAAAT GaATAAAAAT ATAATCATCA AAAGTATTGC AGCATTGGAC GATTTTTAAC 12.00 
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(2) INFORMATION FOR SEQ ID NO: 233: 

(i> SEQUENCE CHARACTERISTICS: 
5 {A) LENGTH: 6444 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



10 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 233: 





TGATAAGTCA 


TTTAAATTGT 


CACCTATTGA 


CATGACTTCT 


TTCATTTCAA 


TCCCTAATCT 


60 


15 


TTCGGCAATT 


GTTTCTAGCG 


CAATACCTTT 


TTGTGCATCT GAATGCGTTA TTTCTATATT 


120 




TCCTCTCGAA GATGATGATA TAGCTAAATT CGGAGAkTCA GCTAAAATTT TACTAGCTTT 


180 




GTCAATTTTT 


TCTAAATTTC 


CATCAAATGC 


TAATATTTTC 


ATAATTAATT 


CACCAGGTAT 


240 


20 


GTTTTCAATA 


GCATCATAAT 


TATCAACAAC 


TyTCAACGTA CCATTATCTA TGCGTCTTTG 


300 




AATACCATTT 


TTAATACGCT 


CAACGTTTGC 


ATGTTGACCT 


GCACGCTCAG 


CAATATCTAT 


360 


25 


GTAAATGTCT 


AAATCTCTTT 


GTGGATCTTC 


AGTATAAATC 


GCACGACTCG 


TGTATACTTG 


420 


ATAATAAATA 


CCTGCATCTT 


TTAAAACATT 


TGTAATTTTG 


TGTACTAACG 


ATTTATTAAG 


480 




GTGTGAAGTG 


CTCATTACAT 


TGAAAGTTTC 


ATCACGTACT 


TCAGCACCAT 


TCAAACAAAT 


540 


30 


ATATGGTACT 


GTTAAATCTG 


TGTCAGCAAC 


TGGTGCTTGk 


GCTTCATAAA 


ATGCTCGACC 


600 




TGTCGCGATA 


ACAACCGTTA 


TCCCTTGTTC 


TTGAGCGTAT 


TTAATCGCAT 


CAATATTAGG 


660 




TTGAGAAATT 


TCATGTGCTG 


CATTAAGTAG 


CGTGCCATCC 


ATATCAGTGG 


CTATTAGTTT 


720 


35 


TATCATTATG 


TnACCTCGTT 


TCGTAAATnT 


AAAATCTTGT 


TCTTAAATAA 


GrATATATAC 


780 




TCAGCGCACA 


TACTTTtCTA 


TTAmCATTTA 


TATkGTCATT 


aATTTATCAT 


ATAATGTAAT 


640 




TCTaACAAAT nTTAAtTAGT ATGTACTATC GTCTAATTGG TGGATTTCTT ATTGGCTCTT 


900 


40 


AAgTTTTTAA AAAATGTTGT TAATAATGTG 


CTACATGCTT 


CTTTAAGTAC ACCTTTATCA 


960 




ACAATTGCAC 


GATGATTAAA 


ATTAGATTGT 


TGCAATAAAT 


TCATTAAACT 


GCcACTACAA 


1020 


45 


CCACCTTTAG 


GATCATCTGC 


GCCATAGACG 


ACTCTTGGAA 


TGCGACTCAT 


TACAATTGTT 


1080 


CCTGCGCACA 


TGACACATGG 


TTCTAAGGTT 


ACATATAATG 


TGCAACCTTC 


TAAACGCCAA 


1140 




CTACCTAACA 


CTTTGGCTGC 


ACGTTCAATT 


GCAATATGTT 


CAGCATGCGC 


CGTTGGTTGT 


1200 


50 


TGTAGTGTTT 


CTCTTaAATT 


ATGTGCTCTA 


GCGATAACTT 


CATCATCTTT 


AGTGATGATA 


1260 




GCACCTATAG 


GTACTTCGCC 


TAGTTGAGCT 


GCTTTTTTAG 


CTTCTTCAAT 


CGCTAATGTC 


1320 




ATAAAATATA 


TATCATTTGT 


CATTTATGTC 


CAGATACCTC 


ACTTATGGTA 


CAATACTCAA 


1380 
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CTATTGGCGT AGGTAAATCT TCACTTGCAC ACAAATTAAG TCAAACTTTA GATTTTTATG 1500 

AAGAAAAAGA AATCATCACA GAAAATCCAT TTTTATCAGA CTTTTATGAA GATATCTCTA 1560 

AATGGAGTTT TCAAACTGAA ATGTTCTTTT TATGCAATAG ATATAAGCAA TTTCAAGATG 1620 

TAACACAACT AAATCAAGGT GTAGTTAGTG ATTATCATAT ACATAAAAAT AAGATATTTG 1680 

CTAAAAATAC TTTGAGTTCT GTTGAATTTC AGAAATTCAG TAAAATTTAT GATATTTTAA 1740 

CTGAAGATAT GATTATGCCG AATATGATTA TCTTTTTAGA TGCAGACCTT GATGTGTTAA 1800 

AATCTAGAAT TGCTAAACGT AACCGTAGTT TTGAGCATCA AATAGAaGtG AtAcTGTaAg I860 

TTAAAAAAAG ATTATCGTGA GTATTATGAG TCCTTACAAA GTAATGGTTC AAATGTAGTT 1920 

TTAATCGATA CnACTTCTAT TGATTTTCTT AAAAATGAAC AAGATTACGA AGATATATTA 1980 

CATATTATAT TACCTATGAT AGGAGATATT ACCAATGAAT AATTACGGTA TTCCACAAAA 2040 

20 TGCCATTATA ACCATTGCAG GTACAGTTGG TGTTGGAAAA TCAACACTAA sGCAAGCACT 2100 

TGCAGATAAA TTAAACTTTA AAACGTCTTT TGAAAATGTC GAACATAATC CATATTTAGA 2160 

TAAATTTTAC AGCGATTTTG AACGATGGAG TTTCCATTTG CAAATTTACT TCTTAGCTGA 2220 

ACGTTTTAAA GAACAAAAGC GTATGTTTGA ATATGGTGGT GGCTTTGTCC AAGATCGATC 2280 

AATTTATGAA GATGTTGATA TTTTTGCAAA AATGCATGAA GAAGAAGGCA CAATGAGTAA 2340 

AGAAGATTTC AAAACATATT CAGACTTATT TAATGCCATG GTCATGACAC CTTATTTTCC 2400 

TAAACCTGAT GTAATGATTT ATTTAgAATG TAACTATGAT GAGGTCATTG ATCGTATTAT 2460 

TGAACGTGGT CGCGAAATGG AAATTAATAC AGACCCTGAA TACTGGAAAA AGCTATTTAA 2520 

ACGCTATGAC GATTGGATTA ATAGCTTTAA TGCATGTCCA GTTGTACGTA TCAATATTAA 2580 

TGAATATGAT ATCCATAAGG ACCCCGAATC TTTAAATCCT ATGATAAACA AAATTGCTCG 2640 

AATTATTCAA ACATATCGAC AAGTAGATAC ACGATAAAAG ACTAAAGACA TAGCGTATAT 2700 

40 GTTTATATTC AATGTATATT CCATAGATAT TATCGATTAT TTTATCAATT CTATCGAATA 2760 

CATTAATTCA CATATACACT ATGTCTTTCT TTTTAATTTA AAGCTTCTAA AATATCTGCC 2820 

GCACTATTTA AAATAATATC AGCTTCATGT AATTCTTCTT TTGTTGCAAT ACCTGTTAAT 2880 

ACACCTATTG CCATACCTAA ATTTGCATTA CTTGCTGTCT TCATATCATT AGCAGTGTCT 294 0 

CCTACTATAG CTACTTTCTG AGGATCTACA TTATATTGCT CAAATAAAGG CGATAATACT 3000 

TTAGGATTTG GCTTCTCATA GGCATCCGCT TCGGTAGAAA TGATCAAATC GAACAACGAG 3060 

GTAGCATTGG TATGTGCTAA AAATTGTTCT ACACCTTTTT TAGTATCACT CGTAACAATA 3120 

CCAAGTTGAT AGCCTTTTGC TTTCAAATCG ATAAGTGCTT CTTTAACACC TTCTACCCAA 3180 
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GTATCTTGTC CCGTCACATC ATTAAATGCC TGGATAATTT GTTGTAAAGA TCCTGAACCC 3300 

ATCACTGATT TTGGATCAAT AGATTCTTTA ATGACACCGA GTTGTCTTAA AGCAGCTTCT 3360 

5 

TTATTATGTA CTGGGAAAGT CTCAAGCAAT GATTGTACAA ATCGTACCCC TATTTTTTCC 3420 

CAACTTCTAT CAAATTCAAT TAACGTACCA TCTTTATCAA ATAATATCCA TTCCATTGaT 34 80 

ATCAATACTC CTATTTATTT ATTTCGTATT ATGCTGATTC TATGATATTC GTTATCCCCT 354 0 

10 

GAAAATGAAC TCGTAGTATT GTTCTATTTA AATATTGaAT TAAATATAAT ' AATAAGTGAA 3600 

ATCCCCTTCA ATACTTAACA ATAAACATTG TAAACTTAAT TTATTACCAT GCTTCGCTTC 3660 

75 ATTGAAAGGG ATTTT AG T CA TGATTAACTT TTGCATATTG TTTTCATGAT TATATTCAAT 3720 

TTTTATTAAT ATTTTGGTAC AACGACTCTC CAACCATTTT TATCTTCTAA AGTACCATTT 3780 

TGAATACCAG TATAGACGTC GTATAATTTT TGAGTAATTT CACCAGTCTC ATTATTATTA 3840 

20 ATAACGATTT CACGATCTTC GTATCTCAAT GTACCCACAG GTGAAATAAC TGCTGCAGTA 3900 

CCACTACCAA ATACTTCTGT TAACTCACCT TTATCATATG ATTCGAATAA TTCATCGATT 3 960 

GAAACGCGGC GCTCTTCGAC TTCATATCCT AAGTTTTTAG CTAATTCGAT AATAGATTTA 4 020 

25 

CGTGTAATAC CAGGTAAAAT ACTGCCATTC AACTCTGGTG TAATTACTTT GCCATTTTCA 4 080 

ACGAAGAAAA TGTTCATGCT ACCAACTTCT TCGATATATT TCTGTTCAAC ACCATCAAGC 4140 

CATAATACTT GGTCATAACC TAATTTATTT GCATTAGTTT GTGCTAATAA ACTTGcCGCA 42 00 

30 

TAGTTACCTG CAACTTTTGC AAAGCCTACA CCGCCACGaA CAGCACGCAC ATATTCATCT 4260 

TCTACATAGA TTTTAGTTGG TTTTAAAGTT TCACCACCAT AATATGCACC TGAAGGAGAT 4320 

3$ AAAATAATTA ATAATTTATA CTGATGTGAT GCACCAACGC CAAGTGCCCC TTCTGTTGCA 4380 

AAAACAAATG GACGAATATA TAATGATTGA CCTTCCCCTT CAGGAATCCA ATCTCTTTCA 444 0 

ATATCAACTA ATTGTTTTAG CCCCTCTAAC AATTCTGCTT CGTCTACTTG AGGCATTTCT 4500 

40 AATCGTGCTA ACGAGTTATT AAGACGCTTA AAATTTTCTT CAGGACGGAA AAGTGCAACT 4560 

TCCCCATCTC TTTTATATGC TTTTAATCCT TCGAATACCG ATTGACCATA ATGAACACCT 4620 

TGTGCAGCAG GTGAAATTTC AATAGGACCA TAAGGTACTA TCTTCAAATC ATGCCATCCT 4680 

45 

TTATCTGCAT CATAATCATA ACTCAACATA TAATCAGTAA AATATTTACC AAAACCTAGT 4 74 0 

TGAGATGTAT TTGGTTTTTG TTTTAATGTT TCTCGTCGTT CAACTTTAAC TGCTTGTGAC 4 800 

ATGGTGATTG CCTCCTAATA ATATTGTATA AGAATTTGTT TAACTTAAAT TATAACAATC 4 860 

50 

CaTATTTTGC TGTTCAACAA ATTTT CT AAA AATTCAAAAT TAATTAACAG ATTTCTAGAA 4 920 

AGACTATATC TTTTAGTATA AACGTATTAA TTTCACAGAG ACAAGTAATC TGTGTTTTAC 4 980 

55 
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TAAGTATAAT GAATAATATT AGAATTCATG CACTAGTTTA TTAAAATAAA GAGTAATTTA 5100 

AAATATCATT CCGTGTATTA AAGTGAATGG AAATGATTAG TTATTATTTT TAACAGTATC 5160 

5 TTTTTGTTCA ATAGCTTCTA ACATTAATTT AGTCATGCTC GCTAAATCAT ATTTAGGATC 5220 

AAATCCCCAT TCGCCACGTG AACAGCTTGT ATCAATAGAA TCCGGCCAAC TATTAGCGAT 5280 

ACCTTGTCTA ATAGGATCAA CATCGTAATC TAATGTAAAA TTGGGATAGT ATTCTTGAAT 5340 

10 

TGCTTCTTTT ACCATCTCTG GATCAAAACT CATTGCGCTC AAATTATAAC CATTTCTAGT 5400 

TTCTAATTTA GCGTCGTCTG CTTCCATAAG TTTAATAATT GCTTCAATTG CATCATCCAT 5460 

ATACATCATA TCCATATACG TGCCTTTATC TATGAAGCTT GTATAATGAC CCTCTCTTAC 5520 

15 

TGCTTTGAAG TATATTTCAA CAGCATAGTC TGTAGTACCG CCACCTGGCT CTTTAACATG 5580 

CGAGATTAAA CCTGGGAATC TAACACTTCT TGTATCTACA CCAAAACGTT TGAAATAGTA 564 0 

20 TTGACACAAT AATTCTCCAG CTACTTTATT TACACCATAC ATTGTCGTAG GTTGCTGAAT 5700 

CGTTACTTGT GGCGTATTAA CTTTAGGAGT TGAGTCTCCA AATGCACCAA TTGAACTTGG 5760 

TGTGAAAAAG TGCAAATTAT AAGTTCTTGC AGCTTCTAAT GCATTCATTA ATCCACCCAT 5820 

25 ATTTAAATCC CAAGCTAGAA TTGGATTTTT CTCAGCAGTT GCTGATAATA ATGCTGCCAT 5880 

ATGCATTAGA CTATCCGCTT CAAAGTCCCT AACTAACTCA AACATACGGT CACGATCTGT 594 0 

TACGTCTAAG ATTTCAAATG GTCCATTTTG TACAGGTGAG TCTGCTTCAG GTTCCCTAAT 6000 

30 

ATCTGTAGCA AGAACATTAT CTGTCCCATA AATTTCTCTG CACTTAACAA CTAATTCTGT 6060 

ACCAATTTGT CCTAATGCAC CAGTAATCAT AATTTTTTTC ATAGAAATAT CTCCTTTGtC 6120 

TCTTCTATAT AGCTATAGTC CATCACAAGC GGaCATAATA TTCATTTTCA TAATAATTAT 6180 

35 

AATATAAAAG CGCTTTCTTG TATATATGAC ATGTACATGT TGCTGATATk TCTGTAAATG 624 0 

GAAATTCTAG TTGTATTAAT TGATTTTAGT AATTTATAGC GTTTATTATT GCTAATTACT 6300 

GtCAAATTAA ATTTTTTATC CCTCAACTCT TAAACTCTGG ATATCTTTCA TTATATTAGC 6360 

40 

TTTTTTATAA CCATGGATAT CATGTAAAGC CTTATAAGCn TTAAATAATG TTTCATACCT 6420 

TTGTACTTnT TCCGCTTCTG GATT 6444 
45 (2) INFORMATION FOR SEQ ID NO: 234: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4721 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

50 (d) topology: linear 

55 



1007 



EP0 786 519 A2 

GCCCATGAGA CAATTTTACT TGCTTTTCCC ATTGGTTATC ACGTTCTTAT TACATAGATT 60 

TAAACCGAGA AATATTATTC AAACGCTATT TATTGTATCG TTGATTTCTT TAGGACTTAT 120 

5 GATAGTGATT CATTTCATCA CTGGAGATAA TTCACGTGTG TATTTTGGGA CAGATACACG 180 

ACTGCAAACT TTATTGCTTG GTTGTATATT AGCATTTATT TGGCCTCCGT TTGCTTTGAA 240 

AAAAGATATT TCTAAAAAGA TTGTCGTATC ATTAGATATT ATAGGGATAT CTGGTTTTGC 300 

10 

GGTTCTAATG ACTTTGTTCT TTATAGTTGG AGACCAAGAT CAATGGATCT ATAATGGAGG 360 

ATTTTACATT ATATCATTTG CAACTTTATT CATTATTGCA ATTGCGGTAC ATCCTTCTAG 420 

15 TTTATTTGCT AAATTTTTAA GTATGAAACC TTTACTAATT ATAGGTAAAC GATCATATAG 480 

CTTATACTTA TGGCATTATC CTATCATTGT TTTTGTGAAC AGTTATTACG TACAAGGACA 540 

AATACCGGTA TACGTTTATA TTATAGAAAT TTTGTTAACA GCGTTAATGG CTGAAATTTC 600 

20 GTATCGCTTT ATTGAAACAC CTATACGTAA AAAAGGATTT AAAGCTTTTG CATTTTTACC 660 

TAAAAAGAAG GGGCAATTTG CTAGAACAGT GTTAGTTATC CTATTATTGG TTCCGTCTAT 720 

CGTTGTGCTC AGTGGACAGT TTGATGCACT TGGCAAACAA CATGAAGCCG AGAAGAAAGA 780 

25 GAAGAAGACG GAATTTAAAA CAACGAAGAA AAAAGTCGTT AAAAAAGATA AGCAAGAGGA 84 0 

TAAGCAGACA GCGAATAGCA AAGAGGATAT TAAAAAGTCA TCACCACTAT TAATTGGTGA 900 

CTCGGTCATG GTGGATATTG GTAATGTCTT TACTAAGAAA ATACCAAATG CACAAATTGA 96 0 

30 

TGGTAAAGTT GGACGGCAAC TCGTTGATGC TACACCAATT GTGAAATCGC AATATAAAGA 1020 

CTATGCTAAA AAAGGTCAAA AAGTTGTAGT AGAGCTTGGT ACAAATGGGG CATTTACGAA 1080 

AGATCAATTA AATGAACTAT TGGATAGTTT TGGAAAAGCA GACATATATT TAGTTTCTAT 1140 

35 

TAGAGTACCT AGAGATTATG AAGGTAGAAT AAATAAATTA ATTTATGAGG CAGCTGAAAA 1200 

GCGCTcTAAT GTACATCTAG TCGATTGGTA TAAAGCTTCT GCAGGTCATC CGGAATACTT 1260 

4Q TGCATATGAC GGTATTCACT TAGAATATGC AGGTAGTAAA GCGCTGACTG ATTTGATTGT 1320 

AAAAACGATG GAAACACATG CTACAAATAA GAAATAATTT GATGCACTAA ACTTTTGAAA 1380 

TATTACATTA CTTCTGATAT TTATTATCAA AAATGATGTA TTTCATTAAA AGTTTAGTGC 1440 

45 TTTTTTATTT TCAAATCCCA TAGTAACGGT GCAGAAAAAG TGTTGTAAAC ATTCTAATTG 1500 

GTATATTACA TTCAATGAAG CTTTATTAGG AACAGATTAC ATTATGATAA CAAAGCCCGC 1560 

AAGACACCTA ATCTCTGTTA TAGTTTGTTT TGTCGCAAAA CTATAAAAGT TATAATTGTT 1620 

50 

TGCATACTAA AAAAATAAAA AATATAAAAT TTAAAATAAT TGAGTCGCTA ATGACTATAT 1680 

GTATAGAGTG TTTTGATTAT TGGGAGGATA TTTAATTATG AAAAAAATCG TTACAGCTAC 1740 
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ACAAAATAAC AATGGATATA ATTCTAATGA CGCTCAATCA TACAGCTATA CGTATACAAT i860 

TGATGCACAA GGTAATTATC ATTACACTTG GACAGGAAAT TGGAATCCAA GTCAATTAAC 1920 

5 GCAAAACAAC ACATACTACT ACAACAACTA CAATACTTAT AGTTATAACA ATGCATCTTA 1980 

CAATAACTAC TATAATCATT CATATCAATA CAATAACTAT ACAAACAATA GTCAAACAGC 204 0 

AACAAATAAC TATTATACTG GTGGTTCAGG TGCAAGTTAT AGCACAACAA GTAATAATGT 2100 

10 

TCATGTGACT ACAACTGCAG CGCCATCTTC AAATGGTCGT TCAATTTCTA ATGGTTATGC 2160 

ATCAGGAAGT AACTTATATA CTTCAGGACA ATGTACTTAT TATGTATTTG ATCGTGTTGG 2220 

TGGGAAAATT GGTTCAACAT GGGGTAACGC AAGTAATTGG GctAACGCAG CTGCATCATC 2280 

15 

TGGCTATACA GTGAACAATA CACCAAAAGT TGGTGCTATC ATGCAAACAA CACAAGGCTA 2340 

TTACGGTCAT GTTGCTTACG TTGAAGGCGT TAACAGCAAC GGTTCTGTTC GTGTTTCAGA 2400 

2Q AATGAACTAT GGACATGGTG CTGGTGTGGT TACGTCTCGT ACAATTTCAG CAAACCAAGC 2460 

AGGTTCATAT AATTTCATTC ATTAATCAAA TGTAAATCAA ATGACGTCAA TATTCTCTAA 2520 

CATGAGAGTA TTGGCGTTTT TGTTTTATAT AAATATAAAT GAGAGCGGTT TATTCACTGA 2580 

25 TCTTTAGGGA ACTAAGTAAT AAAGTGATAA TTTATACTAT GTCAGTATGA TTGAGAGTGA 264 0 

TTCAATTTAG ATGAAAACCA TGAAAAAATA TATTAAAACA GCATTTTTTT GTAGTATGTA 2700 

TTGGTTAATT GTTCAACTAA ATATAGCAAA TTTAGGTACA AGAATTCCTG ATAAGTATTT 2760 

30 TCGTCAGAAG TACATAATAT TTAAATCATT TAACTTTGAG AAGCATGGAA AATTTTGGAA 2 820 

CAAATGGTTT TACGTAAGAA AATGGAAACA TAAGATTTTA GATGGTCATC AGCTTAATCA 2 880 

AAATATATAT GATCAGCGTC ATTTAATGAC AATCAATACT GATGAAATTG AAAAAATGAT 2 94 0 

35 

TATAGAGACA AAGAGGGCAG AGTTGATTCA T7GGATATCG ATACTTCCAG TCATCATATT 3000 

CAATSAAGGC CCTCGTTTAG TAAAGTATAT AAATATTTTC TATGCAATGA TAGCTAATGT 3 060 

TCCAATCATT ATTGTGCAAC GCTATAATCG ACCGAGATTA ACGCAGTTAC TACGCATATT 3120 

40 

AAAACGAAGA GGTGAACGTC ATGACTAAAC ATATCATCGT TATTGGTGGT GGCTTAGGTG 3180 

GGATTTCTGC AGCAATTCGA ATGGCACAAA GTGGCTATTC GGTCTCATTA TATGAACAAA 3240 

45 ATAATCATAT AGGAGGCAAA GTGAATCGTC ATGAATCAGA TGGCTTTGGC TTTGATTTAG 3300 

GTCCATCTAT TTTAACGATG CCTTATATTT TTGAAAAATT ATTCGAATAT AGCAAGAAGC 3360 

AAATGTCAGA CTACGTTACA ATCAAGCGAT TGCCACATCA ATGGCGTAgC TTTTTTCCAG 34 20 

50 ATGGAACGAC TATCGATTTG TATGAAGGTA TTAAAGAAAC AGGTCAGCAT AATGCGATAT 3480 

TGTCGAAACA GGATATAGAG GAACTGCAAA ATTATTTGAA TTATACAAGA CGAATCGATC 3540 
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TTCATGGGCC ATTAAATGCT CTTATTAATT ATGATTATGT ACATACTATG CAACAGGCCA 3660 

TAGACAAGCG TATCTCGAAT CCATACTTGC GACAAATGTT AGGCTATTTT ATCAAATATG 3720 

5 TAGGTTCTTC ATCATACGAT GCGCCAgCTG TATTATCTAT GTTATTCCAT ATGCAACAAG 3780 

AGCAAGGCCT TTGGTATGTA GAAGGTGGAA TCCATCATTT AGCCAATGCC TTGGAAAAGc 3840 

tAGCGCGTGA AGAAGGTGTC ACAATTCATA CAGGTGCACG TGTGGACAAT ATTAAAACAT 3900 

10 

ATCAAAGACG TGTGACGGGT GTCAGATTAG ATACAGGTGA GTTTGTAAAG GCAGATTATA 3960 

TTATTTCAAA TATGGAAGTC ATACCTACTT ATAAATATTT AATTCACCTT GATACTCAAC 4020 

GATTAAACAA ATTAGAGAGG GAATTTGAGC CGGCAAGCTC AGGATATGTG ATGCATTTAG 4080 

15 

GTGTTGCTTG CCAATACCCG CAATTAGCAC ATCATAATTT CTTTTTTACG GAAAATGCTT 4140 

ATCTCAATTA TcAACAAGTT TTTCATGAAA AGGTATTGCC AGATGATCCG ACCATTTATC 4200 

2Q TAGTAAATAC GAATAAAACT GATCACACAC AAGCGCCAGT AGGTTATGAA AATATCAAAG 4260 

TCTTACCACA TATTCCATAT ATTCAAGATC AGCCTTTTAC CACTGAAGAT TATGCGAAGT 4320 

TTAGGGATAA AATTTTGGAT AAATTAGAAA AAATGGGACT TACTGATTTA AGAAAACACA 4380 

25 TTATTTATGA AGATGTTTGG ACACCGGAGg ATATTGAAAA AAATTATCGT TCTAATCGTG 444 0 

GTGCAATATA TGGTGTTGTA GCAGATAAAA AGAAAAACAA AGGATTTAAA TTTCCTAAAG 4500 

AAAGTCAGTA TTTTGAAAAC TTGTACTTTG TAGGTGGATC AGTAAATCCT GGTGGTGGCA 456 0 

30 

TGCCAATGGT TACATTAAGT GGGCAACAAG TCGCAGcAAg ATAAACGCGC GAGAAGCGAA 4620 

GAATAGGAAG TGATATCTAT GAAATGGTTA TCACGAATAT TAACAGTAAT AGTGACCATG 4680 

TCTATGGCGT GTGGTGCaTT GATATTTaAT CgTAGACATC A 4721 

35 

(2) INFORMATION FOR SEQ ID NO: 235: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3516 base pairs 
<B) TYPE: nucleic acid 

40 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



45 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 235: 

TATTCGTGCG CAATGGGCTA AATTAGGTCT AGGTTTAGAT TATAGTAGAG AACGTTTTAC 60 

TTTAGATGAA GGTTTAAGTA AAGCAGTTAA AAAAGTTTTT GTTGATTTAT ACAATAAAGG 120 

50 AATTATTTAT CGTGGCGAAC GTATTATAAA TtGGGATCCn AAAGCACGTA CAGCTTTATC 180 

TGaTATTGAA GTAATACATG AAGATGTTCA AGGTGCGTTT TATCATTTTA AATATCCTTA 240 
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TACAGCGATT 


GTTGTTAACC 


CTAATGACGA 


ACGATACAAA 


GATGTAATCG 


GTAAAACTGT 


360 




TATATTACCA ATCGTAGGAC 


GCGAACTGCC 


T ATTTTAG CA 


GATGAGTATG 


TTGATATAGA 


420 


5 


CTTCGGTTCT 


GGTGCTATGA 


AAGTGACACC 


AGCACATGAC 


CCTAATGATT 


TTGAAATTGG 


460 




TCAAAGACAT 


CAATTAGAAA 


ATATTATCGT 


TATGGATGAA 


AATGGTAAAA 


TGAACGACAA 


540 




AGCGGGTAAA 


TATGAAGGTA 


TGGACCGTTT 


TGATTGTCGT 


AAACAGCTAG 


TTAAAGATTT 


600 


10 


AAAAGAACAA 


GATTTAGTTA 


TCAAGATTGA 


AGATCATGTT 


CATTCTGTAG 


GTCATTCAGA 






ACGATCTGGC 


GCTGTTGTTG 


AACCATATTT 


ATCAACACAA 


TGGTTTGTGC 


GCATGGAAGA 


nod 


15 


CTTAGCGAAA 


CGTTCATTAG 


ATAACCAAAA 


AACAGATGAT 


CGTATTGATT 


TTTATCCGCA 


7R0 


ACGTTTCGAA CATACATTTA ACCAATGGAT GGAAAATATT AGAGATTGGA CGATTTCAAG 


n 
u 




ACAATTATGG 


TGGGGTCATC 


AAATTCCGGC 


TTGGTATCAT 


AAAGAAACAG 


GCGAAATATA 


onn 


20 


TGTTGGAGAA GAAGCGCCAA CTGATATTGA AAATTGGCAA CAAGATGAAG ATGTATTAGA 


OCA 




TACGTGGTTC 


TCaAGTGCTT 


TATGGCCtTT CTCyACGTTA GGTTGGCCTG ATTTAGAAAG 






TGAAGACTTT 


AAACGATACT 


ACCCAACAAA 


TGCCTTAGTT 


ACAGGTTACG 


ATATTATCTT 


lUtJU 


25 


TTTCTGGGTA 


GCACGCATGA 


TATTCCAAGG 


CTTAGAATTT 


ACAGATCGTC 


GTCCATTTAA 


1 1 a n 

X ±H\J 




TGATGTATTA 


TTACACGGTT 


TAGTTCGTGC 


TGAAGACGGG 


CGTAAGATGA 


GTAAATCATT 






AGGTAATGGT 


GTGGATCCAA 


TGGATGTTAT 


TGACGAATAC 


GGTGCTGATA 


GCTTGCGTTA 




30 


CTTCTTAGCA 


ACAGGTTCAT 


CTCCAGGACA 


TGATTTAAGA 


TACTCAACTG 


AAAAAGTTGA 


1 ion 




GTCAGTGTGG 


AACTTTATCA 


ATAAAATCTG 


GAATGGGGCA 


CGTTTCAGTT 


TAATGAATAT 


1JOU 


35 


CGGTGAAGAC 


TTTAAAGTTG 


AAGATATCGA 


TTTAAGTGGT 


AACTTATCAT 


TAGCAGATAA 


144 0 


ATGGATTCTA ACACGTTTAA ATGAAACGAT TGCAACAGTT ACTGATTTAA GTGACAAATA 


1500 




TGAATTCGGC 


GAAGTTGGAC 


GTGCATTATA 


TAATTTCATT 


TGGGATGATT 


TCTGTGATTG 


1560 


40 


GTACATTGAA 


ATGAGTAAAA 


TTCCAATGAA 


TAGTAATGAT 


GAAGAACAAA AACAAGTTAC 


1620 




ACGTTCAGTA 


TTGAGTTATA 


CTTTAGACAA 


TATTATGAGA 


ATGCTACATC 


CATTCATGCC 


1680 




ATTTGTAACA 


GAGAAAATAT 


GG CAAAGTTT 


ACCACATGAA 


GGTGACACAA 


TTGTTAAAGC 


1740 


45 


TTCATGGCCA 


GAAGTGCGTG 


AATCATTGAT 


TTTTGAAGAA 


AGTAAACAAA 


CAATGCAACA 


1800 




ACTTGTTGAA 


ATCATTAAAT 


CTGTAAGACA 


ATCACGTGTA 


GAAGTAAATA 


CGCCATTGTC 


1660 




TAAAGAAATA 


CCTATTTTAA 


TTCAAGCTAA 


AGATAAAGAA 


ATTGAAACAA 


CTTTATCACA 


1920 


50 


AAACAAAGAT 


TATTTAATCA 


AATTCTGTAA 


TCCTAGTACC 


TTAAATATTA gCtGACGTGG 


1980 




AAAwTCCTGA 


GAAAGCAATG 


ACaTCAGTTG 


TAATTGCAGG 


TAAAGTGGTA 


TTACCATTAG 


2040 
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AAAGCGAATT AGATAGAGTA GATAAAAAGC TCTCTAATGA AAACTTTGTA AGTAAAGCAC 2160 

CTGAAAAGGT TATAAATGAA GAAAAACGTA AAAAACAAGA TTATCAAGAA AAATATGATG 2220 

5 

GTGTGAAGGC AAGAATTGAA CAATTAAAAG CATAGGAGTT AGTAACAATG AATTACCTAG 2280 

AGAGCTTGTA TTGGATACAC GAAAGAACTA AATTTGGCAT CAAACCAGGT GTTAAACGTA 2340 

TGGAATGGAT GCTAGCACAA TTTAATAATC CTCAAAATAA CATTAAGGGT ATTCATGTAG 2400 

10 

GTGGCACAAA TGGTAAAGGC TCTACAGTTG CTTACCTTAG AACAGCTTTA GTTGAAAATG 2460 

GTTATGAAGT AGGTACATTT ACGTCGCCGT TTATTGAAAC ATTTAATGAA CGAATTAGTC 2520 

15 TAAATGGTGT GCCAATATCA AATGACGCTA TTGTAGAATT AGTATCACGT ATTAAACCAG 2580 

TAAGTGAAAT GATGGAACGT GAAACAGATT TAGGTGTTGC AACTGAATTC GAAATAATCA 264 0 

CAGCGATGAT GTTTTTATAT TTTGGTGAAA TACATCCTGT TGATTTTGTC ATTGTTGAGG 2700 

20 CTGGATTGGG TATAAAGAAC GATTCGACAA ATGTCTTTAC ACCGGTTTTA TCAATCTTAA 2760 

CTAGTATCGG TCTAGACCAT ACAGATATTT TAGGTGGTAC TTATCTAGAT ATTGCTAGGG 2820 

ATAAAGGCGC GATTATAAAG CCTAACGTTC CAGTGATATA TGCTGTTAAA AATGAAGATG 2880 

25 CATTAAAATA TGTTCGTGAA CGCGCAATTG AACAACATGC AAAGCCAATT GAATTAGATA 2940 

GAGAAATTGT TGTTGTATCG CAAAATGATG AATTTACTTA CCGTTATAAA GATTATGAAT 3000 

TAGAAACAAT CATTTTAAGC ATGTTAGGTG AACATCAGAA ACAAAATGCT GCATTAGCCA 3060 

30 

TAACAGCTCT TATTGAATTA AATGAACAAG GATTAATTGA ATTAGATTTC AATAAGATGA 3120 

TAGACGGTAT TGAATCAGTT CGTTGGACTG GACGTATTGA GCAGGTGCAT GACAAACCTT 3180 

TAATCATTTT GGATGGCGCA CATAATTCAG AGAGTATAGA TGCTCTAATT GATACAATTA 3240 

35 

AACAGTACCA TGATAAAGAA AAAGTAGATA TTTTGTTCTC AGCAATAAAC GGAAAACCGA 3300 

TTAA&AGAT GGTCAAACAT TTAAGTTTAA TTGCGCATAC GTTTTATGCA ACTGAATTTG 3360 

40 ATTTTCCGAA AGCGTTACGC AAAGAAGAAA TTGTAGGTAG TATTGAAAAT GATGAAATAC 3420 

AATTAGTAGA TGACTACGTT GAATTTATAA AAAATTATCA AGGTGATACA TTAGTAATTA 34 80 

CCGGTAGTCT GTATTTCATA AGTGAAGTTA AATCAA 3516 

45 (2) INFORMATION FOR SEQ ID NO: 236: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7481 base pairs 

(B) TYPE: nucleic acid 

so (C) STRANDEDNESS : double * - 

(D) TOPOLOGY: linear 
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TGAGTGATAG AATCAAAAAA GCCATCTCAA AAATTAATCA AGCAAACAAC ATTCCAAACA 60 

ATGsTCGCAA ATCACCAATG TATCACTCTC CAATTACGTA ACTATGATTT AATTTAAGCA 120 

5 

TAGTTATTGA GGTTTTGTGA TATATAGTAT AAAATTAATG AGAATTAAAT TTAATAATGT 180 

AAAATTCATm TTCgGGGTCG GGTGTAATTC CCAACCGGCA GTAAATAAAG CCTGCGACCT 240 

GCTAGTATGT ATCATATTAG TGGCTGATCT AGTGAGATTC TAGAGCCGAC AGTATAGTCT 300 

10 

GGATGGGAGA AGATGGAGGT TTTTTGTTGT GCAATAATCC TCCTATTCTT ACGAGATGAA 360 

TGGAAGGAGA AAATTGAATA TGCAACAAAA TAAACGTCTT ATCACAATAA GTATGTTGAG 420 

1S CGCGATTGCG TTTGTGTTAA CTTTTATCAA GTTTCCTATA CCATTTTTGC CACCATACTT 4 80 

AACTTTAGAT TTTAGTGATG TACCGTCACT ACTAGCTACA TTTACGTTTG GACCAGTTGC 540 

CGGTATCGTA GTTGCACTGG TTAAAAATTT ATTGAACTAC TTATTTAGTA TGGGCGATCC 600 

20 AGTTGGACCA TTTGCTAACT TTTTAGCAGG CGCAAGTTTC TTATTAACTG CTTACGCCAT 660 

CTATAAAAAT AAACGTTCAA CAAAATCTTT GATTACTGGA TTAATCATTG CAACAATCGT 720 

TATGACTATC GTGTTGAGTA TTTTGAACTA TTTCGTTCTA TTACCTTTGT ACGGTATGAT 7 80 

25 ATTTAACTTA GCTGATATCG CAAATAATCT TAAAGTAATC ATTGTTTCAG GAATTATACC 84 0 

ATTCAATATT ATTAAAGGTA TCGTTATTTC TATTGTATTT ATTTTACTAT ATAGAAGGCT 900 

TGCGAATTTC TTGAAAAGAA TTTAATCAAA TTAAAGCAAA ATAATATACA CATAATAATA 960 

30 

. AAAAGCAGGT GACTATCAAT AAACGATAGC TTGCCTGCTT TTTCTATAGA ACATTTGTCT 1020 

AAAAAATCAA TTATTCaAAT TTTAAAGCGT CCCCATCAAA TGATTCGTCT GCAATTTTAA 1080 

TAGAATCTGt AGGGCATCCa TCAATTGCAT CTTCCATATC TTCATATAAT TCCtCAGGTA 1140 

35 

CTTCTGCAGT ACCTTGGTTA TCGTCAAGGA TTACGAAAGC AATACCTTCG TCGTCGTAAT 1200 

CATATATATC TGGCGCTGCT GCACCGcATG CACCACATGC AATACAAGTA TCCATATCAA 1260 

40 CGATTGTATA TTTTGCCAAT GTCTTCGCCT CCTTTGATAA AAATGCTAAA ATAGTAATGT 1320 

GACTAAAATT TTAGACAGCA TCATTTTTAT TTTCAAATTA TCCGTTTTAC AGAGTGAGGG 1380 

TTAAATTTGC AACACATTAT AAAAACAGCA TTACAACAAA CATTTAACTA TAAAACAAAT 1440 

45 AAAAGTATTT ACAATATCTT AGTTGGTAAG AAATCTCACC AAACCTTTTT TGACGCTTGT 1500 

AGTCAACAAC AGTTGTCATT ATATCACAGT TTACCACTAT TAAAATATCC GTCTTTTGAG 1560 

CTATTTtTAG AAAAAATCAA TGAATTTAAT GCTGAAATGG AAATCATGTT GCATCCTAGA 1620 

50 

TATACATTTG aAAGCATGGG GCAAACATTT CAAGCAATTC AACTATTAGT GCAAaCCATG 1680 

TCTAATACCA AACAACATGT TTTTCATTTT GTACCAATCT CTCAAAATAA . TAAGATACAm 174 0 
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AATGAACTAC ATAACTTGTT TAAAGCAATA 
TATTTGCAAG GCTATGATGA ACCAATGTAT 
5 • CTATCTCAAC AGCAATTGTT TGAATACGAA 
TTAGAAAGTG GAGAATATAC TATTTTATCA 
CAAACTTATA TTACTTATAC AAAATTGCTT 

10 

CAACAACAAG TTAAAATCAA TACTATCGAA 
TACATGTCTA ATTACGATGA TTATGTTGAA 

1S TATCAACAGC ATCGTGGCGA ACGATTAAAA 
TATTTTCAAT TAAAAGTATT AATCGTTGGA 
TATTTTACGA AACAAATTTG GATTCGAGAG 

20 AAGTATAATG TCTCAACAAC ACACTCTAGG 
GTGTTATCAA ATACCTACGT ATTTATCAGG 
ATCTTTAATG GATGACCAAG TTATGCAGTT 

25 TATTCACTCT GGTATGGATG AAATTGAGAA 
CCGCTTCATC TTTCTAAGTC CAGAATTTCT 
TATGATAGAC TTTGGCATGA TTGTTCTAGA 

30 

TGATTTCAGA CCACATTATG CTCTAATAGG 
TGTCTTAGCA TTGACAGCAA CTGCACCACC 
AGCGATTCAA TTCAATGTTA TTAAAACTAC 

35 

TCTTAATTTT CATGATGATG AAGATAAAAT 
GGGAGCAACG ATTATTTATG TCTCATCGAA 

40 TTATGATTCA GGTTTTCTTA CAGGTATTTA 
CACAGTTCAA CAACAATTTT TAAATAATGA 
TGGTATGGGA ATTAATAAAA AAGATATTCG 

45 TCCTTCTAAC TACATTCAAG AAATTGGCCG 
AATTAGTTTA TTCCAACCGG ACGATAAATA 
GATAACAGAA GAAGATGTAC AAAATTTCGA 

50 

AGCCGTTTTG ACAACGTTGc AATCATTCTA 
GCAATCATTT AAACGAAAGC AATTAGGATT 

55 



ACTTTAAAAG GGCCATGTTA CTTACATTAT i860 

ACGAGACAGC AAGTTAGTTT AATAGAAAAG 1920 

ATGAATAATT TAGTGACAAT GATGTTTGAA 1980 

AAAATAATAA TGAAACCTAC ATTATTAAAT 204 0 

GAACAATTCA CGATGGAAGA TATAGCGGCT 2100 

GATCATGTAC TTGAAATCTT AATCAAAGGT 2160 

CTAGAAGATC AACTCCAGTT TTTGAATTTT 2220 

TTTTACAAAG AACAATTTGA CACGTTATCA 2280 

TTTGAAAGAG GTGATCTGAA TGTTGCATGA 2340 

TTTTAAACCG GGACAACAGG AAATTATAGA 2400 

TATACTTCCA ACTGGAAGTG GAAAGAGTTT 2460 

TAAGCCGACA TTAATTATCT CACCGTTAAT 2520 

GAAAATAAAT GGAGAAAAAC GTGTAACATG 2580 

AAAGCATAAT ATTAAATGTT TACGACATAG 2640' 

CCTGCAACCG TCAAATTTTA AATTAATATC 2700 

TGAAGCACAT TGCCTATCTG AATGGGGATA 2760 

AAAAGTAACA AAGCATTTTA AAGAAGCGGT 2820 

GCATTTACAA GATGATTTGA CGGAAATGTT 2880 

AATGAATCGC CCAAATATAA GCTTTAAGCA 2 94 0 

TGAATGGTTG CTGCCGTTTC TACAACAGTC 3000 

AAAGATGTGT CTGAATTTAG CGCAACTTAT 3060 

TCATGGTGAT ATGAATTATC AAGAGCGACA 312 0 

TATTCCGATT ATAGTCGCAA CGAGTGCTTT 3180 

CACAATCATT CACTTTCATC TTTCAACAAG 324 0 

TGCGGGTCGC GATGGTGAAC TAAGTCAGGC 3300 

TATTTTAGAA ACGTTATTAT TTGCAGATAT 33 60 

AATAGGAGAA TTTTTAGCTC CCGATAAACA 3420 

TAGTATCGGC GCCTTGaAAC AGATATTTAA 34 80 

CTTTCGCATG ATTGGCTATT GCAAATTGGA 3 540 
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ATGTTGTGAC AATGATTCTA ATATAACTGA TATCGCAATT TTAAATAAGA AGAAGGTAAT 3660 

TAGAAGTATT GGATTTGATG AAAAGTTGCA AAATTTATTT CTCAGATAGT ATTACTTTAC 3720 

5 

TAAAAGAAAA TTGACAAGCT ATAATTAGTG TATACACAAT TGAAAAATGA TTGAAATAAT 3780 

TTTGAAAAAT ATACATAAAC ATATGTCATG TGGGTATATT TTATGTAAAA TCATTGTAAT 3840 

AGAATAGAAA GGAAGATGGC TATGTCTAAT AATTTTAAAG ATGACTTTGA AAAAAATCGT 3 900 

10 

CAATCGATAG ACACAAATTC ACATCAAGAC CATACGGAAG ATGTTGAAAA AGACCAATCA 3960 

GAATTAGAAC ATCAGGATAC AATAGAGAAT ACGGAGCAAC AGTTTCCGCC AAGAAATGCC 4020 

t5 CAAAGAAGAA AAAGACGCCG TGATTTAGCA ACGAATCATA ATAAACAAGT TCACAATGAA 4080 

TCACAAACAT CTGAAGACAA TGTTCAAAAT GAGGCTGGCA CAATAGATGA TCGTCAAGTC 4140 

GAATCATCAC ACAGTACTGA AaGTCAAGAA CCTAGCCATC AAGACAGTAC ACCTCAACAT 4200 

20 GAAGAGGAAT ATTATAATAA GAATGCTTTT GCAATGGATA AATCACATCC AGAACCAATC 4260 

GAAGACAATG ATAAACACGA TACTATTAAA AATGCAGAAA ATAACACTGA GCATTCAACA 4320 

GTTTCTGATA AGAGTGAAGC TGAACAATCT CAGCAACCTA AACCATATTT TACAACAGGT 4380 

25 

GCTAACCAAT CAGAAACATC AAAAAATGAA CATGATAATG ATTCTGTAAA ACAAGATCAA 4440 

GATGAACCTA AAGAACATCA TAATGGTAAA AAAGCAGCAG CTATTGGTGC TGGAACAGCA 4500 

GGTGTTGCAG GTGCAGCTGG TGCAATGGCT GCTTCTAAAG CTAAGAAACA TTCAAATGAC 4 560 

30 

GCTCAAAACA AAAGTAATTC TGGCAAGGCG AATAACTCGA CTGAGGATAA AGCGTCTCAA 4620 

GATAAGTCTA AAGATCATCA TAATGGCAAA AAAGGTGCAG CGATCGGTGC TGGAACAGCA 4680 

35 GGTTTGGCTG GAGGCGCAgC AAGTAAAAGT GCTTCTGCCG CTTCAAAACC ACATGCCTCT 4740 

AATAATGCAA GCCAAAACCA TGATGAACAT GACAATCATG ACAGAGATAA AGAACGTAAA 4800 

AAAGGTGGCA TGGCCAAAGT ATTGTTACCA TTAATTGCAG CTGTACTAAT TATCGGTGCA 4 860 

40 TTAGCGATAT TTGGAGGCAT GGCATTAAAC AATCATAATA ATGGTACAAA AGAAAATAAA 4 920 

ATCGCGAATA CAAATAAAAA TAATGCTGAT GAAAGTAAAG ACAAAGACAC ATCTAAAGAC 4 980 

GCTTCTAAAG ATAAATCAAA ATCTACAGAC AGTGATAAAT CAAAAGAGGA TCAAGACAAA 5040 

45 GCGACTAAAG ATGAATCTGA TAATGATCAA AACAACGCTA ATCAAGCGAA CAATCAAGCA 5100 

CAAAATAATC AAAATCAACA ACAAGCTAAT CAAAATCAAC AACAGCAACA ACAACGTCAA 5160 

GGTGGTGGCC AAAGACATAC AGTGAATGGT CAAGAAAACT TATACCGTAT CGCAATTCAA 5220 

50 

TACTACGGTT CAGGTTCACC GGAAAATGTT GAAAAAATTA GACGTGCCAA TGGTTTAAGT 5280 

GGTAACAATA TTAGAAACGG TCAACAAATC GTTATTCCAT AATATAACTA TATAAATTGT 5340 

55 
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TAAATTGCGC TTATAAGTAT GTAGCGGTTT TTTCATTTTT CAAAGTTTGT TATTTAACAA 54 60 

GGTCTTGTCT CGAATATTGG CATATCAATT TAACTTTTTA AATAGTCATC AAAAAGATAA 5520 

AACACCACAA TCAACAAATT TAACGAGGAA GAATAAAAAA TAAATCAACA TATTAAATTG 5580 

TAGTGTTATT CAACTCCGTA GCTAACAATT CTCTATTCAC ATTAAACAAA TTGTCAAAAA 564 0 

TATATCATAA ATCTTCAAGC ACAGACTTAG CGCATCAATC ACTGAACTGT TATAATAGTT 5700 

TGGGATTAAA GGAGGCCGAA ACAATGCAAA AAGTTGAAAG TATCATAATT GGTGGAGGGC 5760 

CATGCGGATT AAGTGCGGCT ATTGAACAAA AAAGAAAAGG TATTGATACC TTAATTATTG 5820 

AAAAGGGTAA TGTCGTTGAA TCAATCTACA ATTATCCTAC TCACCAAACA TTTTTCTCAT 5880 

CAAGTGATAA ATTAAGTATT GGGcGAgTAC CGTTTATCGT TGAAGAAAGT AAACCAAGAC 5940 

GTAATCAAGC GCTAGTTTAT TACCGAGAAG TTGTAAAACA TCATCAATTA AAAGTAAATG 6000 

20 CATTTGAAGA AGTATTAACT GTTAAAAAAA TGAATAATAA ATTTACTATT ACTACGACGA 6060 

AAGATGTTTA TGAATGTCGA TTTTTAACAA TCGCGACAGG CTATTATGGT CAGCATAATA 6120 

CATTAGAAGT TGAAGGTGCG GATTTACCTA AAGTGTTCCA TTATTTTAAA GAGGCACATC 6X80 

25 CGTATTTTGA TCAAGATGTT GTAATTATCG GTGGTAAGAA TTCGGCTATC GATGCTGCTT 6240 

TGGAGTTGGA AAAAGCTGGT GCTAACGTGA CGGTTCTATA TCGTGGTGGA GATTATTCGC 6300 

CTTCAATTAA ACCGTGGATA CTTCCAAATT TCACAGCATT AGTAAATCAT GAAAAAATTG 6360 

ACATGGAATT TAATGCTAAT GTTACCCAAA TAACTGAAGA TACTGTGACT TATGAAGTAA 6420 

ATGGTGAAAG TAAAACGATA CACAATGATT ATGTATTTGC GATGATTGGT TATCATCCCG 64 80 

ATTATGAATT TTTAAAATCT GTAGGCATTC AAATTAATAC AAATGAATTT GGAACAGCGC 6540 

CTATGTATAA TAAAGAAACA TACGAAACAA ATATCGAAAA TTGCTATATT GCAGGTGTAA 6600 

TTGCTGCAGG GAACGATGCG AATACCATTT TTATTGAAAA TGGTAAATTC CACGGGGGCA 6660 

TTATTGCTCA AAGCATGCTA GCTAAGAAAC AAACGCCCTT AGAATCATAA AAATAAAGGT 6720 

CTATGTACTA AATAACTTAG TTTTACAACG ACTGACATTC ATGATATGTC AAATGAGGTT 6780 

GATGACTATT GATTGTACAT AGACCTTTTT ATGTTACGTA TTCATTATAA TTCAAAATAT 684 0 

45 GATTTGATTT CAGCTTTATC TAAATTGTTG CTTAACGCGA CTAATAATTT TAATCTTGCT 6900 

TTTGGACCAT TCAAGCCGTT AGAAAAAATA AAACCTTGTT GTGCGAGTTG GTAACCACCA 6960 

CCATCGTATG CGTAAGTTGG ACTCACAATA CCATTAAAGG AACGTGAAAC TAGCACAATA 702 0 

50 GGTATATTTA AAGATACTAA TTGTTGAATG CCTTCTAATG CGCTTGGAGG TATGTTGCCT 7080 

TGTCCTAACG CTTCAATAAC CATACCATCG ATACCTTCTC GACTATAAAA ACTAAAAATG 714 0 
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TCCAATGCTT GTTGGCGATA TGGCATATGA TGGAATTGCA CACGATCCTT TGTCAATACA 



7260 



CCTAGCGGAC CATGATTTGG ACTTTGAAAT GTGTTTGTAT TAGACGTATG TGTTTTGGTA 



7320 



ACATTACGCG CCGTATGAAT TTCATCATTA AaTACAACCA TCACGCCTTT ATGACGGGCC 



7380 



TTTTCATCAG AGGCAACGCG AATAGCGGAA ATATAATTAT ATAATCCGTC AGAACCAATT 



7440 



TCATTAGACG AGCGCATTGG CCAAGAAnTA ACAACAGGTT G 
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(2) INFORMATION FOR SEQ ID NO: 237: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6346 base pairs 
<B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 237: 

ATGAATTATA CCTTCCACTA GAAGTGTCGG TATTTATGTG CCTGGTGGTA AAGCAAGTTA 60 

TCCTTCAACG GTATTAATGA CAGCGACGTT AGCACAAGTA GCAGGTGTGG AAAATATTGT 120 

CGTTGTGACA CCACCTCAAC CTAATGGTGT GTCTCAAGAA GTATTAGCAG CATGCTATAT 180 

TACGCAAGTT GATCAAGTAT TTCAAGTTGG TGGTGCTCAA AGTATTGCTG CGTTAACTTA 240 

TGGCACAGAA ACGATACCTA AAGTTGATAA GATTGTAGGT CCAGGCAATC AATTTGTTGC 300 

ATATGCCAAG AAATATTTAT TTGGACAAGT AGGTATTGAC CAAATAGCTG GACCAACAGA 360 

AATAGCACTT ATTATTGATG AAACAGCAGA TTTAGATGCC ATCGTATATG ATGTTTTTGC 420 

ACAAGCAGAA CATGATGAAT TAGCACGTAC ATATGCCATT AGTGAAGATG CGCAAGTCCT 480 

TAAAGATTTA GAATCACGTA TTGCTAAAGC ATTGCCTAAT GTGGACAGAT ACGACATTGT 540 

TTCTAAAAGT ATCGCTAATC AACACTACCT TATCCATGCT AGTAATTTTG ATGAAGCATG 600 

CCATGTCATG AATACAATCG CGCCTGAACA TGCGTCGATT CAAACAGTAA ATCCTCAACC 660 

ATATATTGAA AAAGTGAAAT ATGTGGGTGC ATTGTTTATT GGACATTATT CGCCAGAGGT 720 

CATAGGAGAT TACGTTGCAG GTCCAAGTCA TGTATTACCT ACAAATAGAA CAGCTAGATT 780 

TACCAATGGG TTATCGGTCA ATGATTTCTT AACACGGAAC ACGGTCATCC ATTTATCAAA ' 84 0 

AGATACGTTT GAACAAATTG CTGATTCAGC ACAACATATT GCTCATGTTG AAGCATTATA 900 

CAATCACCAG CAGTCTATTT TAATACGTCA GTCTTAGGGG AGTGTAATTG AAATGATTTA 960 

TATTGATAAA AATGAAAGTC CAGTTACGCC GTTGGATGAA AAAACAATGA CGTCTATTAT 1020 

TAGTGCAACg CnATATAATT TATATCCTGA TGCAGCATAT GAACAATTCA AGGAAGCTTA 1080 
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GATTCAAAAG TTAATGCTGA TCATGCCAGA AGGTCCGGCA TTAACGCTAA ATCCTGATTT 1200 

TTTTATGTAT CAAGCATATG CGGCACAAGT AAATCGTGAA ATTGGATTTG TAGATGCAGG 1260 

5 ATCAGATTTA ACGTTTGATT TGGAAACCAT TTTAACGAAA ATCGATGAAG TACAACCATC 1320 

ATTTTTTATT ATGAGTAATC CACATAACCC TTCAGGCAAG CAATTTGATA CGGCATTTTT 1380 

AACAGCTATT GCAGATAAGA TGAAAGCATT AAACGGATAC TTTGTCATTG ATGAAGCATA 1440 

10 

TTTAGATTAT GGTACGGCAT ATGACGTGGA ACTGGCACCA CACATCTTAA GAATGCGTAC 1500 

ATTATCAAAG GCGTTTGGAA TTGCCGGCTT AAGATTAGGT GTCTTAATTA GTACTGCTGG 1560 

AACGATAAAG CATATTCAAA AAATAGAACA TCCATATCCA TTAAATGTAT TTACGCTAAA 1620 

15 

TATTGCGACT TATATTTTTA GACATAGAGA AGAGACAAGA CAATTTTTAA CGATGCAACG 1680 

ACAGTTAGCT GAGCAGTTAA AACAAATATT TGATACACAT GTTGCAGATA AAATGTCAGT 1740 

20 GTTCCCATCA AATGCTAATT TTGTACTTAC TAAAGGCTCA GCAGCGCAAC AATTAGGACA 1800 

ATACGTATAT GAACAAGGAT TTAAACCTCG CTTTTATGAT GAGCCGGTGA TGAAGGGCTA 1860 

TGTAAGATAC TCAATTGCAA CAGCATCACA GTTAAAGCAA TTAGAAGAAA TTGTTAAAGA 1920 

25 ATGGAGTGCA AAATATGATT TATCAAAAAC AACGAAACAC AGCTGAAACG CAACTAAATA 1980 

TTTCAATATC TGATGATCAG TCACCATCGC ATATTAATAC AGGTGTGGGC TTTTTAAATC 2040 

ATATGTTAAC CTTGTTTACA TTTCATAGCG GTCTGTCATT AAACATTGAG GCACAAGGTG 2100 

30 ATATTGACGT AGATGATCAC CACGTAACTG AAGATATCGG CATTGTCATT GGCCAATTGT 2160 

TACTTGAAAT GATTAAAGAT AAAAAGCATT TCGTTCGTTA TGGAACGATG TACATTCCAA 2220 

TGGATGAAAC ATTAGCACGT GTCGTTGTGG ATATAAGTGG GCGCCCATAC CTATCATTCA 2280 

35 

ATGCATCATT AAGTAAAGAA AAAGTTGGTA CGTTTGATAC GGAGTTAGTA GAAGAATTTT 234 0 

TTAGAGCGGT CGTAATCAAT GCAAGATTAA CAACGCATAT TGATTTAATT CGTGGAGGTA 2400 

ATACACACCA TGAAATTGAA GCTATATTCA AAGCGTTTTC CCGTGCATTA GGCATAGCGC 2460 

40 

TAACTGCAAC TGATGATCAG CGTGTGCCGT CATCGAAAGG TGTGATTGAA TGATTGTCAT 2520 

. CGTTGATTAT GGATTAGGGA ATATTAGTAA TGTAAAACGC GCTATTGAAC ATTTAGGGTA 2580 

45 TGAGGTGGTT GTCTCAAATA CCTCAAAAAT AATCGATCAA GCAGAAACAA TCATATTGCC 2640 

CGGTGTCGGC CATTTTAAAG ATGCGATGTC AGAGATAAAA CGATTAAATC TCAATGCAAT 2700 

ATTGGCTAAG AATACTGATA AGAAGATGAT TGGTATTTGT TTAGGCATGC AATTAATGTA 2760 

50 TGAGCATAGT GATGAAGGCG ATGCATCTGG ATTAGGGTTT ATCCCAGGAA ATATTTCGCG 2820 

TATCCAAACA GAATACCCAG TGCCACACTT AGGCTGGAAT AATTTAGTGA GTAAGCACCC 2880 

55 
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AATTGCATAT GCGCAGTATG GGGCTGATAT 
TGGTATTCAA TTCCATCCTG AAAAAAGCGG 
5 AATACAAGGG GGATTTATAA ATGATTGAAT 
CAAGTGTGAG GTTAACAGAG GGTAAATATG 
AAGAAAGTAT TGCTTACTAT AGTCAATTTG 

10 

TGATAGGTGC TAAGGCACAG CATGCCCGAG 
TAACAACCAA AGATATTGAA GTAGGTGGTG 
ACTTTGCCGC AGGGATTAAT TATTGCATAG 

15 

GGCTTAAAGA GATGGCACAT ACATTTCCAG 
GAGAAGATAT TAAAGTGAAC GGATGGGAAG 

20 TGAGACGGTT ATCGGATATA CCTCTTGGCG 
GCAAAATGTC CGGACCTAAC TTTGAATTAA 
CTGTCATTGC TTCCGGTGGT ATTAGACATC 

25 ATGTTCACGC TGCTATTATA GGAAAGGCTG 
AATGATTAAA AAACGTATCA TTCCATGTTT 
GATTCAATTT AAAGGATTAA GGGATATTGG 

30 TGAAGCGGGT GCTGATGAAT TAGTATTTTT 
CTTAATGCTA GAAGTGATTG AACAGACAGC 
GGGTGGGATT CAAAGTCTCG ATGATATTAC 

35 

ATCATTAAAT TCAAGTGCTT TAAAAAATCC 
CGGTAGACAA TGCATCTGCA TAGCAATTGA 
TTATTGTTGT ACGACTGGTG GTAAAAAAAT 

40 

GCAAGTAGAA CAGTTAGGTG CAGGTGAGCT 
GAAACAAGGC TTTGATATTG AACACCTAGC 

45 CATTGCTTCT GGTGGTGGTG GCAATGCACA 
TGTTTCTGCA GGTTTAGCTG CAAGTATATT 
TAAAGAAGTG ATACGGCAAG GGGGTATAGC 

50 AGCAAAGGTT TAGTGCCAGC AATTTTACAA 
GGTTATATGA ACCAAGAAGC TTTTGATAAA 

55 



TCCGGCAATT GTTCAATTTA ACAATTATAT 3000 

TACATATGGG TTACAAATTT TGCGTCAGGC 3060 

TATGGCCAGC GATTGATTTG ATTGGGTCAA 3120 

ATAGTGAAGA AAAAATGTCA CGCTCGGCTG 3180 

AATGTGTGAA TCGTATTCAT ATCGTCGACT 3240 

AGTTTGATTA TATTAAGTCA TTGAGGAGAT 3300 

GCATTCGTAC GAAGTCACAA ATCATGGACT 3360 

TTGGAACGAA AGGTATTCAA GATACTGATT 3420 

GTCGCATTTA TTTATCTGTT GATGCCTATG 34 80 

AGGACACAGA GTTAAATTTA TTTAGTTTTG 354 0 

GCATTATATA TACTGATATT GCTAAAGATG 3600 

CTGGTCAATT AGTAAAGGCA ACGACGATTC 3660 

AGCAAGATAT TCAACGATTA GCGTCGCTAA 3720 

CACATCAAGC ATCTTTTTGG GAGGGGCTAA 3 780 

AGATGTCAAA GATGGTCGTG TCGTTAAAGG 3840 

GAATCCTGTT GATTTAGCAA TGTATTACAA 3900 

AGACATCTCT AAGACGGAAG AGGGTCATAG 3 960 

GTCACGCTTG TTTATCCCTC TTACTGTAGG 4020 

CCAATTGCTA AATCATGGTG CAGATAAAGT 4080 

ACAGCTCATT AAACAAGCGA GTGATAAATT 4140 

TAGCTATTAT GATCCTGAAA GAAAAGCACA 4200 

GACAAATATT AAAGTATATG ACTGGGTACA 4260 

CCTCGTTACA AGTATGGGAC ATGATGGTAT 4320 

AAATATTAAG TCTCTTGTAA ATATTCCAAT 4380 

ACACTTTGTA GAATTATTTG ATCAGACGGA 444 0 

ACATGATCGA GAAACGACGG TTCAATCTAT 4500 

AGTAAGATGA CCAAATATAA AATTGATTTT 4560 

GATAATCAAA CAAAACAAGT ATTGATGTTG 4620 

ACGATAGAAG ATGGTGTGGT ATGTTTCTAT 4680 
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AAAGATATTC ATGTAGATTG CGACAATGAC ACTATTTTAA TTGATGTCAT ACCAAATGGA 4800 

CCAACATGTC ATACAGGCAG TCAAAGTTGT TTCAACACAG AAGTTCCATT TTCAGTGCAA 4860 

ACATTAGCGC AGACAGTTCA AGATAGTGCC CAATCCAATA ATGAAAAGTC ATATACAAAA 4 920 

TATTTATTAA CAGAAGGTAT AGAAAAGATT ACAAAAAAAT ACGGTGAAGA AGCTTTTGAA 4980 

GTCGTAATTG AAGCAATTAA AGGTGACAAA AAAGCATTTG TAAGTGAAGT AGCAGATGAA 5040 

CTTTATCATT TATTTGTCTT GATGCATGCG CTTGGCGTCG ATTTTTCAGA AATTGAGGCG 5100 

GAATTAGCGC GTAGACATCA TAAGCGCAAT AACTTTAAAG GTGAACGACA AAATATCGAA 5160 

CAGTGGTAAA GCAAGTATGG ACTAAGATAT AAGGAAAAGG ATCATGGCTT ATACACTTAC 5220 

AAATATTGTG GAAAACGTGA CATTTTCAAG TTTAAAATAC GACACCAACA TATTTTAACT 5280 

ATGAATGCTG TGATGGTACT AAAGTTGCGA ACTCGTTATA GATAAGTAGT GGATAATCAC 5340 

AATACGAAAT CAAAAATAAT TATAAAAAGT AAATTGAGCA ACTCAGGAAT AGATGTCACT 54 00 

GTTAAAGATG TCGAAAAGTA TATGAATCGA TATAATGAAG TTATGAAGGG AAAAAATGGC 5460 

GAAAAAGCTA AAGAGTTATG TTTGTCGTTA CTACCTATTA ATATCATAGT TGTCTTTACA 5520 

25 TTCTTTGTAT TTATACTATA AATACAAATA TATCTAGCCT GAAATAGAAA TGTCATAGCC 5580 

TATTTAAAAG ACAATCTCCA TTAGAACTAA GATATGCATC CCGAAAGTTA , GACTAAAAAA 564 0 

CTAACTTTAT GGGATGTATT TTTATGCTAA TCATCATAAA TTCGAGATTA AGTTAAAGGT 5700 

AGTTCAAGAG TAATTAAACA ATAAATwAAA AATAGTAGGA TACTTACTTT GAGGGAAGAA 5760 

AATTAACTGT ATATATTTAG TTTAGGAACA AGTATTACGG TTTATCCTGA TACAATTATT 5820 

GTGGATGGGA TGATATTTTT AGGTTTAAAA TACGACACCA GCAAACATAA TAACTGTAAT 5880 

AGCTCATAAA TCTCCCCATA TAGCTAATCT AAAAAAATAA TACATCATTG GAATTAAGCC 5940 

CCAAQCATGT AAATATTAAA AATCAAAAmA GATATmTGTA AAAaAGTTAC AATTtGCATA 6000 

ATTAAATTGT GTCTAATTAT TGACTAATTA AATTTTGCCA AATATAATAT TAATTAATAA 6060 

TTTGaAATGA TTAGCGTATA CACTTTAAAT TCTCTTTGGA GAATATATTT TTTAAATACA 6120 

AATGTAAACG CTTTCTCGTC AAATTAAACA ATAGAAAGGA TGGTCATTAT GAGTGCTTGG 6180 

45 TTAAGTAAAT TATTTGAGTT TATTCCTCGA ATAATTATCA ATTTGTTTAT CTAAAATAAA 6240 

AAAATAGAGG TGCTGACAAT GATGAAAAGT CAAAATAAGT ATAGTATTCG TAAATTTAGT 6300 

GTAGGTGCAT CTTCCATTTT AATAGCTACA TTACTATTTT TAAGTG 6346 

SO (2) INFORMATION FOR SEQ ID NO: 238: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3775 base pairs 
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iC) ■ STRANDEDNESS : double 
(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 238: 

TGATAATGAT TCTCATTGTC ATACATCACG AAGGAGGCTA ATTAGTCAAT GAATAAAGTA 60 

ATTAAAATGC TTGTTGTTAC GCTTGCTTTC CTACTTGTTT TAGCAGGATG TAGTGGGAAT 120 

TCAAATAAAC AATCATCTGA TAACAAAGAT AAGGAAACAA CTTCAATTAA ACATGCAATG 180 

GGtACAACTG AAATTAAAGG GAAACCAAAG CGTGTTGTTA CGCTATATCA AGGTGCCACT 240 

IS GACGTCGCTG TATCTTTAGG TGTTAAACCT GTAGGTGCTG TAGAATCATG GACACAAAAA 300 

CCGAAATTCG AATACATAAA AAATGATTTA AAAGATACTA AGATTGTAGG TCAAGAACCT 360 

GCACCTAACT TAGAGGAAAT CTCTAAATTA AAACCGGACT TAATTGTCGC GTCAAAAGTT 420 

AGAAATGAAA AAGTTTACGA TCAATTATCT AAAATCGCAC CAACAGTTTC TACTGATACA 4 80 

GTTTTCAAAT TCAAAGATAC AACTAAGTTA ATGGGGAAAG CTTTAGGGAA AGAAAAAGAA 540 

GCTGAAGATT TACTTAAAAA GTACGATGAT AAAGTAGCTG CATTCCAAAA AGATGCAAAA 600 

GCAAAGTATA AAGATGCATG GCCATTGAAA GCTTCAGTTG TTAACTTCCG TGCTGATCAT 660 

ACAAGAATTT ATGCTGGTGG ATATGCTGGT GAAATCTTAA ATGATTTAGG ATTCAAACGT 720 

AATAAAGACT TACAAAAACA AGTTGATAAT GGTAAAGATA TTATCCAACT TACATCTAAA 780 

GAAAGCATTC CATTAATGAA CGCTGATCAT ATTTTTGTAG TAAAATCAGA TCCAAATGCG 840 

AAAGATGCTG CATTAGTTAA AAAGACTGAA AGCGAATGGA CTTCAAGTAA AGAGTGGAAA 900 

AATTTAGACG CaGTTAAAAA CAACCAAGTA TCTGATGATT TAGATGAAAT CACTTGGAAC 960 

TTAGCTGGCG GATATAAATC TTCATTAAAA CTTATTGACG ATTTATATGA AAAGTTAAAT 1020 

ATTGAAAAAC AATCAAAATA ATTAAGGAGT TTTACGATGC TACTTAAACC AAAATACCAA 1080 

40 ATCGTTATTG CTGGTTTATG. TCTTGCAATA GTAGCTATCT TAAGTTTAAT GATTGGAAAT 114 0 

ACGCTTGTGT CACCAGGTAC GGTGATACAG GCGTTATTCA ACTTTGATAG TGAAAACGAT 1200 

TTACATGATG TTGTCACTGG TGCACGGGCG TCGAGAACAA TCATTGCGTT ATTGACTGGT 1260 

GCTGCCCTTG CTGTCTCAGG TTTGTTGATG CAAGCACTTA CACGAAACCC AATAGCCTCA 1320 

CCAGGGCTTT TCGGTGTCAA TGCAGGCGCA GTATTTTTTG TCATTTTTAG TATTACATTT 1380 

ATCCAAATTC AATCTTTTAA AATGATTGTA GTTATTGCAT TTTTGGGGGC TATTGTTGTT 144 0 

ACTGTATTAG TTGTTGCACT AGGTATGTTT AGACAAACAC TATTCTCACC TCACCGTGTC 1500 

ATTTTGGCAG GTGCTGCGAT TGCGATGCTA TTTACAGCCT TTACTCAAGG CATACTTATT 1560 
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AATATTTGGG ATATCCCATG GATTATTCCG 
AGCATGGCTG CACACATCAA CATCTTGATG 
5 CAAAACATAA AATTAATCAA ATGGATGATT 

TCGGTAGCCG TAGCTGGATC AATCGTCTTT 
CGATTATTAC CACCAAACTA TAAGTATTTA 

10 

CTAATGATCA TTTCAGACAT TGTTGCTCGT 
GGTGTCGTTA CCGCTGTCAT TGGCGCTATT 
CAACGCTTAT GACCGAAAAG ATTAATAAAA 

15 

TCTTTTTAGC CATCGTTTCA GTGGTAAGTA 
AACGCGTACT GATGTACTTT ATAAATCCAA 
TATTACGCTT ACCTCGCATT ACACTTGCGA 

20 

GTTTAATGTT GCAAAATGTA TTAAAAAATC 
CAGGTGGTGC TAG CTTAAGT GCTGTTGTCT 

25 ATTTACTTCC ACTATTTGCA GTATTAGGTG 

TTCAAACGAA AGGACAAATA CGCCCGACAA 
CGTTGTTTAT TGCGCTTGTC CAAGGATTAC 

30 AAGCTTATAC ATGGCTAGTC GGAAGTCTTT 

TGGGTATGGT TATTTTAGCT GTTGTGCCGT 
TATCTATACT TGATGACCCT GTAGCGATTG 

55 TAATCCAATT AATCACTTCT ACTATACTCG 

TTGGGTTTGT CGGTTTAATC GCACCACATA 
CTAAAAAGTT ACTAATGTCA GCAATGATTG 

40 

TTGGGCGTAC CTTATTCTTG CCTAAAGAAG 
GTGCCCCATT CTTCATATAC TTATTATTAA 
ACAAAATGAC CTCACAACGA AGTTAGCTAA 

45 

TTTTTATACA TATAGTTGTT GTTATTGTTA 
ATACTTTATA TACAAATAAC ACCGACTCAT 
50 TTTTCAAATA TCGATAACTA TTTCTTATTT 
AAAAACACAA ATTTTAATAA AAATATCATA 

55 



CTTGTATTGA TACTTATTTT AATTGCATTT 1680 

ACAAGTGACG ACATTGCAAC CGGCCTCGGT 1740 

ATTATGCTCA TCAGTATGTT AGCCGGTATT 1800 

GTGGGTCTTA TCGTACCGAA TATTAGCAAA 1860 

ATTCCTTTTA CTGCATTAGC TGGAGCAATC 1920 

ATAATAATTA AGCCACTAGA GTTGCCTATC 1980 

GTCTTAATCT ATATTATGAA GAAAGGACGT 2040 

AAGACAATTA C CAT CT CATC TTCGCGTTAA 2100 

TGATGATTGG TTCAAGCTTT ATACCATTAC 2160 

ATGACAGTAT GGATCAATTC ACTTTAGAAG 2220 

TTTTAGCAGG TGCCGCACTA GGAATGAGTG 2280 

CAATTGCCTC ACCTGATATT ATCGGTATCA 2340 

TTATTGCATT TTTCAGCCAT TTAACAATAC 2400 

GCGCAGTTGC AATGATGATA CTATTAGTGT 2460 

CACTCATAAT CATCGGTATT TCGATGCAAA 2520 

TCATTACAAC GAAGCAATTA TCTGCTGCCA 2 580 

ACGGTGCTAC GTTTAAAGAT ACAATCATTT 2640 

TGTTATTTCT TGTTATACCA AAAATGAAAA 2700 

GCTTAGGCTT ACATGTACAA CGTATGAAAC 2760 

TATCTATGGC AATCAGTTTA GTAGGTAACA 2820 

TCGCGAAAAC AATCGTTCGC GGAAGTTATG 2880 

GTGCCATATC AATTGTTATT GCAGACTTAA 2S4 0 

TGCCAGCAGG TGTATTTATT GCTGCTTTTG 3000 

CCGTGAAAAA GTTATAACGA TATTATTAAA 3060 

ATGATTCAGT TAACTAACCG TTGCGAGGTT 3120 

ACAAGCGTCG ACTTTCTTAA TTACATATTA 3180 

ATTCTATAAT ATCAATCAAT ATTCTTCGAT 3240 

AAATATAGTG TTTGATAATG TCATTTATTC 3300 

TTATTTTTAA TTGTAAATTA TGGATTATTT 3360 
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ATATAATAAC CATGACAAAA TTAGAGATTT TATAATCATT GAAGCATATA TGtnTCGTTT 34 80 

TAAGAAAAAA GTCAAGCCTG AAGTCGATAT GACTATAAAA GAATTTATAT TACTGACTTA 3540 

5 TTTATTTCAT CAGCAAGAAA ACACACTTCC ATTTAAGAAG ATTGTTTCAG ATTTATGTTA 3600 

TAAACAATCG GATTTAGTAC AGCATATAAA AGTACTTGTG AAACATTCAT ATATTAGTAA 3660 

AGTTCGAAGT AAAATTGATG AGCGTAATAC TTACATTTCA ATATCTGAAG AACAACnAGA 3720 

10 

nAAAATTGCA GAACnTGTTA CATTGTTTGA TCAAATCATT AAACAATTTA ACCTT 3775 

(2) INFORMATION FOR SEQ ID NO: 239: 

(i) SEQUENCE CHARACTERISTICS: 
« (A) LENGTH: 1361 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 

20 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 239: 
AGAAAAATTA GCCTACCTAT GCAAGTTGTT ATTGCATTAG TGTTAGGTGT TGTCGTAGGA 60 

2$ CTTTTATTAT ATGGACAAGA AAACGTAGCA AATTACATTA AACCATTTGG TGACGTATTT 120 

TTAAATTTAA TTAAAATGAT CGTTATACCA GTTGTATTTT GCTCACTAGC GCTTTCTATT 160 
TCGAACGTTG GGGAATCGAA AACTGTAGGG CGTTATGGCT GGaAAACAAT TTTATACTTT 240 

30 GAAATTATTA CAACAATCGC AATAGGTTTA GGGATTATCT TCGGTAACCT ATTTAAACCA 300 

GGTGCTGGAT TAGACCCAAC AAAATTACCT AAAGGTGATA TTTCTAAATA TCAATCAACT 360 

GCACATGCAG CAGAACAATC TACATATGGa AATCATTTTA TTGATACCAT TGTACATATT 420 

ATTCCGACAA ACTTTTTTGA AGCTTTAAAT AAGGGTGAAT TATTACCTAT TATCTTCTTC 480 

GCAGTATTCT TTGGATTAGG ATTAGCTGCT GTAGGTAAAA AAGCAGAACC AGTTAAAGAA 540 

TTTTTAAGCG GATCGCTTGA AGCTGTGTTC TGGATGATTA ATAAAATTTT AAAATTAGCA 600 

40 

CCACTTGGAG TGTTTGCATT CATTTGTACT ACAATTATTA CATTTGGTGC ATCCGCATTA 660 

TTACCACTAT TAAAATTAGT ATTAGTTGTT GTCTTTGCAA TGGTGTTCTT TGTATTCGCT 720 

ATACTAGGAC TAGTTGCATG GATGTGTGGT ATTAATATCA TGAATATTAT TAGAATCTTG 780 

45 

AAAAGTGAAT TGCTTTTAGC ATTTTCTACA TCAAGTTCGG AAGCTGTACT TCCTGTAATG 840 

ATGAAGAAAA TGGAAAACTT CGGTTCTCCA AAAGAAATTA CTTCTTTTGT TATACCAATT 900 

50 GGTTATACGT TTAACTTAGA TGGATCAGCA CTTTATCAAT CTATTGCAGC ATTATTCGTT 960 

GCACAGATGT ATGGAATGCA CTTAACATTA TCAGAGCAAA TTGTGTTGAT GTTAACATTA 1020 

55 
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ACATTAGGTG CCATGGGCTT ACCGGCACAA GGTTTAGCAT TAATTATTGG TGTTGACCGT 



1140 



ATCTTAGATA TGGTACGTAC ATGTGTAAAC GTTATTGGTA ATGCATTATC AACAATCGTT 



1200 



ATAGCTAAAT GGGAAAACGT ATATGACAAA GCAAAAGGTC AAGAATATTT AAAATCAATT 



1260 



TAAAAAATAC TATCTGACAT TTAArGnCCC TTACAACCTT TGGTTgTnAG GGCTnTTTTA 



1320 



TGTCATGCGT CTTAAAGCCA GGCCGTATAn CGGTAAGCGT A 



1361 



10 



15 



20 



25 



30 



35 



40 



45 



50 



(2) INFORMATION FOR SEQ ID NO: 240: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1489 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 240: 

TCAATATGTA AATCGGCGAT TGTCCCTATC tTCATACCCT TACCTTCTTT ACTCAAATTA 60 

AAATGTTATT TATTATGCCA TaGCTTATCT AATATATATA GTTAACTGCT TCATTTAGAT 120 

GATTATTTTA TATTTTTGCA TAAAAACTTA TATCTTTTCA AAAAAATCGA TAAGTTTTAG 180 

TTATCATACC CTTACCTATC AAATGTTTTT TCTTATATTT AAAAAAATAA TTGCTTTATT 240 

AAATGGATTT CTTTAGTATT TATAATTAAG AAAACGCTTA CACACAACTT TTTTATTTGC 3 00 

TTTATCCTGA GGAGGAAAAT TATGGCAAGA AAATTGCATA GAGAGTTGAA TAACAGACAC 36 0 

ATCCAATTAA TAGCAATTGG GGGCGCAATT GGAACTGGGT TATTCCTAGG ATCAGGTCAA 420 

ACAATATCTT TAACTGGTCC ATCACTGTTA TTCACATACA TGATTATTGG GGTTGTACTA 4 80 

TTCGCTTTTA TGCGCGCATT AGGCGAATTG TTGTTGAGCA ATACAAGATT TAATTCATTT 540 

GTTGATATTG CAAATGAATA TTTAGGCCCT TTTGGTGGCT TTGTCATTGG CTGGACTTAC 600 

TGGTTATGTT GGATTGTATC AAGTATGTCA GACCTAACTG CGATGGGACA ATACTTTGCA 660 

TTTTGGTATC CACAAGTCCC AAATTGGATT ACCGTGCTAT TTATTGTTTT AATCTTGATT 720 

AGCTTCAACT TATTAGGTGC CAGATTATTT GGTGAACTGG AGTTTTGGTT CTCGATTATT 780 

AAAGTTGTCA CAATTATTGC GATGGTTATC GTTGGTCTTG TATTAATCTT TTTCTCATTT 840 

AAAACACATT ATGGACATGC ATCATTCACA AACTTAATCA GTCACGGTGG CATGTTCCCT 900 

GGTGG Aa CAT TTGGTTTCTT AATGTCATTC CAAATTGCTG TATATTCATT CATTGGTATT 960 

GAACTTATAG GTGTAaCTGC TGGTGAAaCG AAAGATCCTG AAAAAACCTT ACCGAAAGCA 1020 

ATTAATAATG TACCTATCCG TATTTTATTA TTCTATATCG GTGGTCTATT AGTAATTATG 1080 



1024 



EP0 786 519 A2 



TTAATCGGCG TACCATTTGC AGCAGGTGTC GTTAACTTTG TCGTGCTAAC TGCCGCGGCC 1200 

TCTGCTACAA ATAGTGGTAT CTATTCGAAT AGTCGTATCT TATTCGGACT GTCACAACAA 1260 

5 GGGTTAGGTC CTAAAGTTTT AAATAAAACG AATAGTCATG GCGTGCCTTA TTTATCAATG 1320 

TTAGTTTCAT CAATTGCATT ACTTATAGCA GCCTTGTTAA ACTACATTTT CCCTAATGCA 1380 

ATTCAACTAT TCATATACGT TACAACGTTA tCAACTGTGT TGTTTTTAGT TGTtTGGGCA 1440 

10 

ATGATnATTG TCGCTTATCn AATGTATTTG GAAAAAGCAT CCTGAGGCA 14 89 

(2) INFORMATION FOR SEQ ID NO: 241: 

(i) SEQUENCE CHARACTERISTICS: 
15 (A) LENGTH: 5000 base pairs 

(B) TYPE: nucleic acid 
tC) STRANDEDNESS : double 
(D) TOPOLOGY: linear 



20 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 241: 





TTTTCCATCA 


TrATcACCAT 


TTAAGACAAT 


AGCTGTATGA CCATATCCTC 


CACCAAATCT 


60 


25 


TCCACTAAAA ACCACTAAGT 


CCCCAGGTTC 


AGCTTTGAAA GTTGGTGTGT 


TGTGATAAAT 


120 




TTTAGCTTCA 


CTATTAAAAT 


TATTTGCATA 


TGGTATATCT TTAGCTCCAT 


ATCCTTTtAA 


180 




TCCAkGACCA 


TAAAGAkGAT 


TCCAATATAC 


ATTAACTAAA TCGAAACATT 


GCCATCCATA 


240 


30 


ACTACCGTCG 


AAATCCCATC 


CTCTATTCTC 


TAATGTTTTC AAATAATTTA 


ATGTACTGCT 


300 




ATTACTATTA 


CTTTTATTAT 


TTGAAGACAC 


TGTTTTTGGT TTTGGTTCTA 


CTAATGGTGT 


360 




CATTGGCACT 


TTTAATTTTT 


GACCAATAAA 


TATTAAATTA GGATTTGCTA 


TATTATTTGT 


420 


35 


ATTTTGAATA 


TTTGAAACTG 


TAGTTTTGTA 


TTTTAATGCT ATAGCACTAA 


GTGTGTCTCC 


480 




TTTT-KTACA 


GTATAGATTT 


GTGTTTTTGG 


AGCTTCTCTA AAACTGTAGT 


AACCAAAGTA 


540 


40 


ATTATTAGTA 


ACTTTATTCG 


TTTTCTTCTG 


ATTAGAATTT TGAGCTTCCA 


AGTTTGCAAT 


600 


TTTAATTTCT 


TTAGTAAGTT 


CATTGTTATT 


AATAACTAGA TTGTTACCTT 


GGCTTGAGTT , 


660 




TTTCGGAGTA 


TTTGAAATCT 


TTATATCTTG 


ATTAATTTCA TTTCCGTTTG 


AAATTGCTGA 


72Q 


45 


TTTGTTGTCT 


AACTTTAAAC 


TTGTGTCCGA 


TGTTTTAACA GCACCTTCAT 


TTTTTATTTT 


780 


GTCTTTTGTC 


GTATTTTTAT 


TAGCATTTAA 


CTCTGATTTC GCGAATACAT 


TTTGCTCATA 


840 




CCCTCTTGTA 


AAATCTTTAG 


ATTTATCAAT 


TTCATCTGCA TATGCTTTGT 


TCGACATACC 


900 


50 


CAATGCCAAA 


AACATACCTA 


TTGAAATTGA 


CAAAATTCCA ATACTAACTT 


TTCTAATTGA 


960 




ATAGCGTACT 


TTACTTTGTT 


GTTTATTCAT 


GATGAAACAC TCCTTACAAT 


AATATACAAA 


1020 
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GTAGGAGGTA AAATAATTAA CTTGTCTTTC 
GCACGACAAA TAGCCCATTT CCGATACTTT 
5 ATATCATCTT TTAACTTTAT TTATTAACAG 

TAGCAGCTTC AATTAATGTT GAACCAATTT 
AACTATTTAA TGTTTTAATT TTCTCTTCAG 

10 

CAGCATGTCC CATACGTTTT CCAGGAGGTG 
GTTTTGTCAT ATTCGCTTTA ATCCATTCAG 
CACCAATCAT AACAACTGCT TTCGTTTCGT 

15 

TAAAGTTTGT TCCGTTGACT GGGTCTCCAC 
CTTCTTCAGT CAATTGGTGC ACTGCTTCAT 
CAACATGACC TTTTTTGTGA ATATAGCCAG 

20 

TAATCACACC TGGACAGTTC GGACCAACTA 
TAACTTTAAC CATGTCTAAT ACAGGAATAT 

2S CTGCATCAGC TGCTTCTAAA ATTGAGTCTG 

AAACCGTTGC CCCAGTTTCA TTTTTAGCTT 
CAACAACTTG ACCACCTTTA CCAGGCGTCA 

30 GCATTTGTTT TGTATGGAAA AGGGCAGTAG 

TATTCTTATC TATAAATACA CTCATCTTAG 
CTAGTTTAAC AATTTTTTGT GCACCTTCAG 

35 

CTGAGTCTTT TAAGATTTTT TTACCTAACT 

GTGGTAAAGT TAAATCTACT TCTTTTACAG 

ATTTCATAAT GCCACCGAAA ATGTTTACAA 

40 

TGATTTTAAA TGCTTCAGTT ACTTTTTCTC 

TGGCTGGGTT TCCACCGAAA TGATTAATCG 

CATTAACCAT ACATCCGATG TCACCATCTA 

45 

CTTCAATCTC TTTCGGATCT TCTTCTTCTA 
TGAATAATGC ATTATCATCA AAATTAATTT 
50 CTGTTGTAAC TAATGGGTTG ATTTCTACGA 
AAAGTGCTAA TAAGAATTTA GCAGCTTTGT 



CAAAATATGA AAAGTGTACT AAAaTTCATC 114 0 

TATAAAGTAT GGAaTGGGCT ATAGCCATTT 1200 

TTAATAATGA TTCATAAATA CCTGCTTCTT 1260 

CTGAAGGTGT TGCCGCTGTT TTCACACCAC 1320 

CAGTACCTTT ACCACCTGAA ATGATTGCAC 1380 

CTGTTTGTCC ACCGATAAAG CCTACAACTG 1440 

CTGCTTCTTC TTCAGCCGTA CCACCGATTT 1500 

CATCTTCATT GAATGCTTTT AAAACATCAA 1560 

CAATACCAAC AGCTGTAGTT TGACCAATAC 1620 

ATGTTAATGT ACCTGAACGA GATACTACAC 16 80 

GCATAATACC AATTTTACAT TCATCTGCTG 1740 

AACGTGTTTT TCTACCTTGT AAGTAGCGTT 1800 

GTTCAGTGAT ACAAATAACC ATATCTAAGT 1B60 

CAGCAAATGG TGCTGGAACG TAAATGACTG 1920 

CTTCAACAGT GTTGAAAACA GGAACGCCTT 1980 

CACCTGCTAC TATTTTCGTA CCATAATCAA 2040 

ACCCTGTAAT ACCTTGTACC ATTACTTTAG 2100 

TGCTCCCATC CTTTCCTTAT GCTTCTTTGA 2160 

CCATTGTTGC TGCTGGTTCA ATTGCTAATC 2220 

CAACATTTGT ACCTTCTAGG CGTACAACTA 2280 

CTTCAACGAT ACCTTCTGCG ATAACATCAC 2340 

AAATACCTTT AACATTTTCA TCACCTAAAA 2400 

TAGTAGCGCT TCCGCCTGCA TCTAAGAAAT 2460 

TATCCATTGT TGCCATGGCT AAACCTGCAC 2520 

ATGCAATGTA TGATAAATCA TGTTTAGACG 2580 
AATCACGTAA TTCTACAACA TCTTTATGTC ' * 2640 

TAGCATCTAA TGCCAATACA TCACCATCAG 2700 

TTGAACAATC TTTTTCAATG AATACATTAT 2760 

TAACAGATTC TTTAGGAATA TTAATATTAA 2820 
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AGATCTTTTC AGGAGTCTTC GCAGCAACTT CTTCAATCTC AGTGCCCCCT 


TCTTCAGACG 


2940 




CCATCAATGT TACTTGGTCA GTCGCACGAT CAATAACGAA TCCAACGTAA 


T ATT CTTTTT 


3000 


5 


GAATAGCACA ACCTTCTTCG ATATATAAAC GCTTAATTTC TTTACCTTCT 


GGACCAGTTT 


3060 




GATGTGTCAC CAAAGTTTTC CCTAATAATT CTTTTGCATA TGTTTCTACC 


TCAGATAAAG 


3120 




ATTTAGCAAT TTTTACTCCG CCTGCTTTAC CXCTACCTCC AGCATGAATT 


TGTGCTTTTA 


3180 


10 


CAACATAAAC ATCAGAATTT AATTCTTTTG CTTTCTCCAC CGCTTCTTCA GCAGTAAATG 


3240 




CTACTCGTCC TTCTGGAACT GCAACGCCCA TTGAACGAAA TATTTCTTTA CCTTGATACT 


3300 


15 


CGTGGATATT CATCTTCCAT CCTCCTGTTA CTTAGGTTAA GTTCCCTTAC 


AATTATAAAA 


3360 


AATGTAAGCG CTATTGTAAA CTTAAATGCT ACTTTTTTAT CATTTAATTG 


AATTTTACGA 


3420 




TTTACAGTAA CGATTTTATA GGTTCAAAGC TTTTTCTATG CTCTTTCATA ATGCCAATAT 


3480 


20 


CATCGATTGC TAGTAAATGT TGTTTGGTAC CGTAACCCGC GTTTTTTTCA 


AAACCATATT 


3540 




CAGGATAATC TTTAGATAAC TGTGTCATAT AATCATCACG AAAAACCTTT GCCATGATAC 


3600 




TTGCAGCTGC AATGGACACA CTTCTTGCAT CACCCTTGAT TAAAGATACT 


TGAGGCAGTG 


3660 


25 


CATTATCAAG CGTCATCGCG TCTATCAATA AATGCGTTGG TTGTACTGAT 


AATCCATCAA 


3720 




TAGCTCGCTG CATGGCGATT TGAGTAGCTT TATAAATATT AAATTCATCT 


ATTTCTTnCA 


3780 




GtGTCGCGAT CCCATATGCA AAAGCAGTAA CTTCATTTTT TAGTGCTTCA 


TTTAATTCTA 


3840 


30 


GACGTTTCGT AACAGGTACT TTTTTCGAGT CATCAAGGCC CAAATAATTG 


TGATTTGAAT 


3900 




TTAAAATTGT TGCGCATGCA ACGACTGGAC CTGCTAAAGG TCCTCTTCCA 


ACTTCATCAA 


3960 




TCCCACAAAT AATAGCATTA GGATGCTCTT TTAATATTTC ATTTTCAAAG 


TAAGTCATTT 


4020 


35 


CAACATACTT TTCTTTTAAA GCTTGTTCTT TTTCTAACGC TTTTCTGCGC 


CTAGCTATGG 


4080 




CATTTTGAAC ACCTTTTCGC TCATCTAAAA AGCATTCATG ATTTTCTAAT 


TCTTCTATTG 


4140 


40 


TATTAACCGC ATTAATCAAC TGCGTAACTT CTTTAATTGT TAGCGTCATT 


TGCTAATTCC 


4200 


TCAGTCATAT CTTTAAAAAT ATCAAAACAA TAATTTCCTA TTTTAGCATT 


TCGAATATCA 


4260 




TAAATAATCA GTTCAATGAC TGCTTCGTAA TCAATTTCAT TACCACGTCG AATTAAGCCc 


4320 


45 


ACGTTTTTTC CCTATCGCAT CAAACCACGC TATGATTTCT GCAtCTTCAG 


GAACTTCAAT 


4380 


ATTATAATGT GACTTTAATC GCGCTAAATC ATTTTGAATT AAAAAGTTTA 


ATCCATAGAT 


4440 




GGCAACTTCA TCTAAGTGCA CAATACTATC TTTTATCGCA CCAGTTAAAC 


TCAACTTCTT 


4500 


50 


ACCGACTTCT TCATCTTCAA ATTTAGGCCA AAGTATCCCT GGTGTGTCTA ATAGTTGTAA 


4560 




TGCATTACCA ACTTTAATCC ATTGTTGTTG TTTGGTCACA CCTGGTTTAT 


TACCAGTCTG 


4620 
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10 



15 



20 



30 



35 



40 



45 



AACGATCATT GCTCTTATCG CTCTAGGTTT AAGTCCTTTC GCTTTTTCGC GTTCAAATTT 4740 

TTCAGCAGTC GCCTTAATTG CTGCAGCTTC CACTTTCTTT AAATTTTTAC CGTGCTTAGC 4800 

ATCCACTGAT ACAGGATAgT AtCCTTTATC AATAAAAAAT tGTTCCCATT TTGACATCTC 4860 

ATTTAAATTA GACATATCTT TTTTATTTAA TATAACAACA CGTGGTTTTT GGTTAATAAC 4 920 

TTCATCTATC ATAGGGTTTC TTGAACTATA TGGAATTCTT GCATCTACTA GTTCAAACAC 4 980 

TACATCTACT TTTTTTAATT 5000 
(2) INFORMATION FOR SEQ ID NO: 242: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1700 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 242: 

AACCCGnAGA CGAAACTnCA TAGTTGCCTG TTATGTTGAT TAGTGCGTTT GTAGCTATTT 60 

25 nAAATCAAAC ATTATTAAAT ACAGCGTTaC CTAGTATAAT GAGAGAATTA AATATCAATG 120 

AAAGTACATC GCAATGGCTA GTTACTGGGT TTATGCTTGT TAATGGCGTC ATGATACCTC 180 

TGACGGCATA TCTAATGGAT AGAATTAAAA CTAGACCTTT ATACTTAGCG GCGATGGGGA 24 0 

CATTTTTATT AGGTTCTATT GTTGCAGCCT TAGCTCCGAA TTTTGGAGTT TTAATGTTAG 300 

CTCGTGTAAT TCAAGCGATG GGTGCAGGCG TACTTATGCC CTTAATGCAA TTTACGTTAT 360 

TTACATTGTT CAGTAAAGAA CATCGAGGTy TtGCAATGGG ACTAGCAGGT TTAGTAATTC 420 

AATTTGCACC AGCAATAGGA CCTACAGTTA CAGGATTAAT TATTGATCAA GCGAGTTGGC 480 

GAGTTCCATT TATTATAATT GTAGGAATTG CTATACTTGC CTTTGTTTTC GGTTTGGTTT 540 

CAATCTCGAG TTACAATGAA GTGAAATATA CGAAATTAGA TAAGCGTTCA GTAATGTATT 600 

CAACTATTGG GTTCGGGTTA ATGCTATACG CATTTAGTAG TGCAGGAGAT TTAGGATTTA 660 

CAAGTCCAAT AGTAATAGGT GCGTTGATAT TAAGTATGGT TATTATCTAT TTATTTATAC 720 

GTAGACAATT TAATATTACT AATGCACTTT TAAATTTAAG GGTTTTTAAA AATAGAACAT 780 

TTGCATTATG TACGATTAGT TCAATGATTA TAATGATGTC AATGGTTGGA CCTGCGCTGC 840 

TTATACCGCT ATATGTTCAA AACAGTTTAT CTTTATCTGC CTTGTTATCA GGACTTGTTA 900 

50 TCATGCCTGG TGCAATAATA AATGGTATTA TGTCAGTTTT TACAGGTAAA TTTTATGATA 960 

AGTATGGTCC TAGACCATTG ATTTATACTG GTTTTACAAT TTTAACAATT ACTACAATTA 1020 
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10 



15 



GAATGTTTTC AGTTTCTTTA CTCATGATGC CGATAAATAC TACAGGAATT AATTCTTTGA 1140 

GAAATGAAGA AATCTCACAT GGCACGGCTA TTATGAACTT TGGTCGTGTA ATGGCTGGTT 1200 

CACTAGGCAC AGCTTTAATG GTTACATTAA TGAGTTTTGG TGCAAAAATA TTTTTATCTA 1260 

CATCGCCATC GCATTTAACT GCAACTGAAA TTAAACAGCA ATCCATTGCT ATAGGGGTGG 1320 

ATATCTCATT TGCTTTTGTA GCTGTGCTTG TTATGGCAGC TTATGTGATA GCACTTTTTA 1380 

TAAGAGAACC TAAAGAAATA GAAAGTAATA GAAGGAAATT TTAAAATAAT TATAGTAGTT 144 0 

GGTCTATTTA AAATAATAGG CTAACTGCTT TTTTTATTTA ATAAAAAGTT TTATACTTTT 1500 

AGTGATAGAC TAAGCAAAAA TTGTTATTTG CTATGATGTA GATGTCTTAA AATGATTAAG 1560 

GGGGATTTGC TTTGTTAACG GTAGATCAAG TGAAAGAATT GGTAGGAGAA ATTAAAGATC 1620 

CTATTATAGA TGTGCCTTTA AAAGAAACAG AAGGTATTGT TGAnGTTTCT ATTAAGGGAG 1680 

2o AAnAAGAACA TGTGAGTGTT 1700 

(2) INFORMATION FOR SEQ ID NO: 243: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 10146 base pairs 
25 (B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

30 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 243: 

TGCATCAACT TTCAAACAAT AAATCATCAC AATAACCACA CCTAATTCAA CACTTTTCAA 60 

ACATAAGTAT TGACACATTG AGCAAAATGA TTTTTAATTG TAACTAATAC AGTTACAATT 120 

ATGAGGTGAG AAACATTGAA TTTAGAATTT AACATTGCCG TGCATGTATT AGCTTTTTTA 180 

ACT AAG CATC aTTCAGAAAA ATTCAATAGT AGTTCATTAG CAGAaTTAaC TTGTTTAAAT 24 0 

CCTGTTCAAT TACGACGCGT GACGACTCAA CTTGTCGATT TAAAAATGAT TGACACAATA 300 

CGAGGTAAAG ATGGCGGTTA TTTAGCAAAT GATCAAAGTG CTGATGTCTC TCTAGCAACA 360 

TTATaTAAAC ATTTTGTCTT AGAGAAAGAA CACCACACAC GTCTATTTAC TGGCGACGAA 420 

GGCAGTCACT GTCAAATTGC TCGTAATATT GCAACTACCA TGTCACATTA TCAGCAAGAC 480 

GAACAGAATA TCATTATTAA TTTTTATAAT GG AAAAACAA TCAAAGATGT CATTGAAGAC 54 0 

ATTCAAAAGG AGGATTTATG TCATGAAAAC ATATGATTTA ATTGTAATAG GATTTGGGAA 600 

SO AGCTGGTAAA ACTTTAGCGA AATACGCTGC ATCAACAGGT CAACACGTCG CAGTTATCGA 660 

ACAATCTCCG AAAATGTATG GAGGCACTTG TATAAACATA GGATGTATAC CTTCGAAGAC 720 



55 



35 



40 



45 
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TGTTGTCAAT GCGCTAAACA ATAAAAATTA CCACTTATTA GCAGACGATA ACAACATTGA 840 

TGTACTGGAT TTTAAAGCGC AGTTTAAATC TAATACTGAA GTGAATTTAT TAGATCAACA 900 

5 

TGACGATATC GTCGATAGTA TTACTGCACC TCATATCATT ATTAATACCG GTGCTACCTC 960 

TGTCATTCCT AACATTAAAG GCCTTGATCA AGCTAAACAC GTCTTCGATT CGACAGGTTT 1020 

ATTAAACATT AGCTATCAAC CTAAGCACCT CGTTATTGTA GGTGGCGGTT ATATCGCCTT 1080 

10 

AGAATTTGCT TCAATGTTTG CGAATTTAGG TAGTAAGGTA ACAGTATTAG AACGTGGCGA 1140 

ATCATTTATG CCACGCGAAG ATCAAGATGT CGTTGCATAT GGTATTACTG ACTTAGAAAA 1200 

^ TAAAGGCATT GCATTGCATA CAAATGTTGA AACGACTGAA TTGTCATCTG ACAATCATCA 1260 

TACAACAGTC CATACCAACG TTGGTAACTT TGAGGCTGAT GCAGTACTTT TGGCTATCGG 1320 

GCGCAAACCG AATACGGATT TAGCTTTAGA AAATACTGAT ATCGAATTAG GCGACAGAGG 1380 

20 CGAAATTAAA GTCAATGCTC ATCTTCAAAC AACTGTGCCG CATATTTATG CTGCAGGTGA 1440 

TGTTAAAGGC GGACTTCAAT TTACGTATAT ATCTTTAGAT GATTATCGAA TTATCAAATC 1500 

AGCGTTATAT GGTAATCAGT CAGGTACGAC TGACAATAGA GGCAGCGTGC CTTATACAGT 1560 

25 ATTTATAGAT CCACCATTAT CACGTGTTGG ATTAACTAGT AAAGAAGCTG CCGCTCAACA 1620 

TTATGATTAC ACTGAACATC AACTTTTAGT AAGTGCTATA CCTCGTCATA AAATTAACAA 16 BO 

TGATCCAAGA GGTTTATTTA AAGTAGTCAT TAATAATGAA AATAATATGA TTTTAGGTGC 1740 

30 TACATTATAT GGTAAGCAAT CTGAAGAATT AATTAATATA ATTAAACTTG CGATTGATCA 1800 

AAACATTCCA TATACCGTAT TACGAGATAA TATTTATACG CATCCTACGA TGGCCGAATC 1860 

ATTTAATGAT TTATTTAATT TCTAGACAAA ACATAAAAAC CTGGTGGCAC GCATTGAATG 1920 

35 

ATGCTGCCAT CAGGCTTTAT TGTTGTGCTT TTCGCTTTTC TAATTTTTCT TTAAGCTTTC 1980 

TATCTTGTTC TTCTTTACGA CGTTTACGTT CTTCATGTCG TTTTCTTAAA CGCTCTTCTT 204 0 

CTTCAGGATC ACGTGGTTTC TTTAATTGTT GAGAAACTTT TTCGATTAAT T C TT C TTCAG ' 2100 

40 

TAAGCGCagc CAGTGGGCGG TTATTAACAA AAGTGAATGT TTTTCGGCGT CCAGGTCCAC 2160 

AATAAGATTG ACAACCTATC ACGATTTCAG CATCGGGATC TAATTTTTCC AACTTCTTTT 2220 

45 GTAACGTTCT TATATTGACT GCCTGACATT CATCACAAAT AAGGAATGTA TTTTTCATAT 2280 

TGCTACCCAC CTTTCTTTAT CATATCTATA TCGTCGATTT CATTAATTTT TTCGTTAACT 234 0 

CTATCTATTT TACTCTTTTT AATATTTTTT TCAAGATACG TAACACGGCT GaCAATAAAA 2400 

so AATGGAGCAT TTATCTTCTA ATTAAATTAG ATGaTTGCTC CCCTATCAAA TCATTTATTG 2460 

CCCATGATAA ATATTAAATT TTAATGGTTT AATACCATGT TTTGTCCATT CATCATAAAT 2520 
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TGATGTTTTA GATGCGCCGT GATACTTTTC AGCAATATCA CACAAATATT TTAG C TTTTC 2640 

AGTTTCTATA TCAACTGTAG CTTCTTTATC CATACGTTGA ATAATTGTAC GATTCTGACG 2700 

5 CACCATCTTT TGCACACCTT TAATGTTATT TGTTTTAAAA GCATGAATAA GTTTTTCAAC 2760 

ACAACGATGT GAATCTTCTA AGAAGTCACC GTAAAATGAA GGATCTGATT TCAAACGTTT 2820 

CACTTCGCTA ACAAAGTGTG GTGATGACGC CGGTGAGCCA GTCCAACCGA TAAGTACTTC 2880 

10 

CATATTTTCA GGTGCTTGTA ATGGTTCGAT GTGCAATCCA GGCCAGTTTT TGATTAAAAC 2940 

rTCTTCAACC GTAGTATCTT CAATTTGATG CTTAACCCAT TCATGATCAA AAGTACTATA 3000 

^ CGCTAGCCAT CCACTATATA CACTCACAGC AATATCTCCG CATGAACTTA AACTTTGTAA 3060 

CTTCATATTT GCAATCACTG CTAGTTTATA AATGTATAAA TTAGATAACT TCATATCATA 3120 

AAATTCATTT AATACTTTTA TAACTGACAC AAGTACTGCT GCACTTGAAC CTAATCCATA 3180 

2 0 TTTATGACCA TTTGAATCAT CTAAATTACT ATCAATAGTC AGATGAAAAT GCTTCATCGC 3240 

TATATCGCAA CTTTTCGCGT ATTGTTCAAA TATTTCAATA GCTGTGaCCA CATAATTTAA 3300 

TTGTTTTGCT GcATGTGGAT CTGAAATGAC AATACTATCT TCATCTCTAC TAAATGTAAC 3360 

25 TGGGTTATGA TGTAATGCTT TTGAATGAAT GGTACCTTTA TATTGGTCTG CTTCTTCAAT 3420 

AGTAGCAGTT ACAAAACGAT CTAACGCAAT AAGTACAGAT TTATATCCTG GTTCTGTTAC 3480 

AGCATATTCT CCAGCAATAT AAAGTTTTCC GGGTGCTTTG ACCTGAATCA TTTTATCTCT 354 0 

30 TCCTTACTCA ATTATTTCAA TTCCTGTGGC AATAATGTCA CTATCAATAA TTTGGTTATT 3600 

ATCAAACTGT GTTAATAATT TATCTATAAT CTGTTGCTTG TTTTTCTTTT CTACAAGTAT 3 660 

TTTCACATTA GGTCCCGCAT CCATTGTAAA ATAACACGGA TACCCCGCTT CTCGGCATTC 3720 

35 

GTGAACAAGC GCCATGACAT CATAACTTTC TTGCACAAGA TATGTGAACG GCGGTGTTGA 3780 

TCCTAGATTC GTGGCATGCA TACGCAAACC ATTTTCTTCA ATTACTTCAC CAAGGCGTTT 3840 

AAAATCTTTG TCTTGAATCG CTGCTTTTGC TTCAGCTAAA TCTTCATCAA TATGATCTAA 3 900 

40 

CCAATATTGA TAAAACCTTG ATGTGTTTCG TGTCAATGAC ATACCATATC GACTAGGTAC 3960 

CTTTTTAGAA TGTTGATTAA TCACAACAAA TATCATGGCA AGGTCATCTT CAAAATGATT 4020 

45 CGATTCAAGT GGAACGGCAT ATGACGTCTC ATCACTATAC CCTTTTTCCC ATTCTGCAAA 4080 

TCCACCATAA ATACTACGCG ACGCAGAACC CGAACCAATT CGCGCCAATC TCGATAAATC 4140 

CTTATCTGAC AGCTGCATGT CTAGCGCTTG ATTACAAGCT GCTGCTAAAG CTGCATATGC 4200 

SO GCTTGCCGAT GAAGCCAACC CTGCTGCTGT TGGTACAAAA TTGTCGCTTT CAATTTCTGC 4260 

ATACCAATCG ATGCCAGCTC TATTTCTGAC AATATCCATA TATTTTGAAA TTTTCTCTAA 4 320 
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AAAAGTGACT TTCGTTTCAG TGTAAAATTT TTCTAATGTA ACAGATATGC TATTATTCAT 4440 

TGGAATGATT AGTGCTTCAT CTTTTTTACC CCAATATTTT ATAAGTGCAA TATTCGTATG 4500 

TGCACGTGCT TTGCCACTTT TAATCAACGC ATTAACCTCC TAAATTCTCA ATCCAAGTAT 4560 

GTGCTGCACC AGCTTTTTCT ACAGCTTTTA CAATATTTTT CGCTGTTGGT AAATCTTTGG 4 620 

CAAGCAATAA CATACTTCCA CCACGACCAG CGCCAGTAAG TTTTCCAGCA ATCGCACCAT 4 680 

TTTCTTTACC AATTTTCATT AATTGTTCTA TTTTATCATG ACTAACTGTC AACGCCTTTA 4740 

AATCCGCATG ACATTCATTA AAAATATCCG CTAAGGCTTC AAAGTTATGA TGTTCAATCA 4 800 

CATCACTCGC ACGTAAAACT AACTTACCGA TATGTTTTAC ATGTGACATG TACTGAGGGT 4 860 

CCTCACAAAG TTTATGAACA TCTTCTACTG CTTGTCTTGT TGAACCTTTC ACACCAGTAT 4920 

CTATAACAAC CATATAGCCG TCTAAACTTA ACGTTTTCAA CGTTTCAGCA TGACCTTTTT 4980 

20 GGAACCAAAC TGGTTTGCCT GATACAATCG TTTGCGTATC AATACCACTT GGTTTACCAT 5040 

GTGCAATTTG CTCTGCCCAA TTAGCCTTTT CAATGAGTTC TTCTTTCGTT AATGATTTCC 5100 

CTAAAAAATC ATAACTTGCA CGAACAAAAG CAACCGCGAC AGCTGCACTC GATCCTAATC 5160 

25 CACGTGATGG TGGTAAATTC GTTTGGATCG TTACTGCTAG CGGCTCTGTA ATATTATTTA 5220 

ATTCTACAAA ACGGTTCACC AAAGACTTAA GATGGTCAGG CGCATCATAT AACATACCAT 5280 

CGTAAACATC GCTTTTAATA GACGAATAGT TCCCGCTCTC TAAGGCTTCT ATTAAAACTT 5340 

TGATTTTACC TGCGTTAAAC GGTACTGCAA TAGCAGGCTC TCCAAATGTA ACAGCATGTT 5400 

CTCCTATTAA AATAATCTTA CCTGTCGATT CCCCATATCC TTTTCTTGTC ATGTCAATAT 54 60 

CACCTTTTAT ATTTATCCTA TACTTGATTC ATTATTTTTA TTTATTAGTA AAAGACATCA 5520 

TATTCTAAGT TGCAtngCAT TCGCGTTAAA TTTCATTGCA GTCTTTATCT CACATTATTC 5580 

ATATTATGTA TAATCTTTAT TTTGAATTTA TATTTGACTT AACTTGATTA GTATAAAACT 5640 

AACTTTCGTT TACTTCAAAG TTTAAATCTT ATCGAGTGAT ATTTGAGATT CTTTATCTTT 5700 

TTATAAAATA GCCCTACAAT TTATAATTTT CCACCCTAAC TATAATACTA CAAATAATAA 5760 

TTGGAATATA TAGATTTACT ACTAAAGTAT TAGAACATTT CAATAGAAGG TCGTTTCTTT 5820 

CATAGTCATA CGCATTATAT ATACCCTATT CTCAATCTAT TTAATACGTA AAACATGAAA 5880 

TTTTCTTATT AAATTTATTA TTTCCATCAT ATCATTACTT TTAATTTAAT GATGTTCAAT 5940 

TTAAATATTA GGTCAATAAC ATATTTATGC TTTTTATGGA TACTTTCAAA AATAACAGCC 6000 

50 CCAAACGATA ACTTGAAAGG GGCTGTTAAA TATTTAACTA TTGCATTTGA TCTATCATTT 6060 

. TCTTGTTTCT TTCAATCATT TTATCAAAAT ACGTATCGTA TCTTTGCCAT TCTTCTTGAG 6120 



55 



30 



35 



40 



45 



1032 



EP0 786 519 A2 

TTACATCTTG AACAGTAATC GTTTTGTTAA GCAATGTCTC TAATGAGGCC ATACAAGATG 624 0 

GTTCAATTTC AGGATATTTA AATTTAGTCA CTTCACCTTT TAAAGCATGT TCATAAAATG 6300 

5 TTTGCATCAT CAATGCACGT TCTGAACCAG AGCCTTCAAC ACAAAGATAA ATTTGTACAG 6360 

CAATACCGCC TCTAACTCTT CGTTGCGATA TGCCTGCAAA TTTCTTACCA TCGATACTTA 6420 

AGTCAAATTT TCCTGGGCAA TAAGAATGTT CAATTTCCAT CGTATCAATA TCAACATTCT 64 BO 

10 

CATTTTCGAA CATTTTGCTA ATTAAGAGGT ACATCACAGT AAACGCTTCA TCAATCGTTG .6540 

TTTCTGTTTG TCCTTTGAAC ATCAGCGATA TATTTAATAC ACCTTGATCT AGAACGACAC 6600 

CTAAGCCACC AGAATTTCTA ACAATGGCAT TATAACCAAT CTCATTCGTT AAATAATCAA 6660 

15 

TGCCATCTTT TAAAAACGGC AATCTTGAAT CATGAATACC AAGAATAACA GTATGTTGAT 6720 

GAATCCAAGT ACGCACAACA TTATCTGATA TATCTTTGCC CACACTTTCG CAAAATGTAT 6780 

CATCGAATGC GAAAGATTGC ATAGGTTCTA ATCCAGAAGA ATGATCGATA TATCGCCAGT 6840 

20 

TGACGCCATT AAAATATTTA CTCGCTAAAT CCATCGTTAT TGTAAGGCTT GCGCTGCTGT 6900 

AATAATTGAA AGATTGTATA CATCTTCAAT TGAGCAGCCA CGTGATAAGT CATTTACTGG 6960 

25 AGAATTTAAA CCTTGTAATA CTGGACCAAC TG CAT CAT AT CCACCTAAAC GTTGTGCAAT 7020 

TTTGTAACCA ATATTACCAG CTTCTAAACT TGGGAATACA AAGACATTTG CATCACCTTG 7080 

TAATTTAGCA CCTGGCGCTT TTTTCTCAGC AACACCTGGT ACAATCGCAG CATCAAATTG 714 0 

30 GAATTCGCCA TCAATGATTG CTTCTAATTT TtCTTCTTCA GCTTTTtGTT GTGCTAATTT 7200 

GACAGCTTCT TGAACTTTTG TCACGTCGTC TGATTTAGCA GACCCTTTTG TTGAAAAGCT 7260 

TAACATTGCA ACTTTTGGAT CCATGCCAAA GCTTAATGCT GATTTTGCAC TTTCTACTGC 7320 

35 AATTTCTGCA AGTCCTTGTG AATCAAGTTC TGGATTGATT GCACAATCAC CAAAGATGTA 7380 

TTGrTCATCA CCTTTAATCA TAAAGAAGAT ACCTGATGTT CTTGATACAC CTGGTTTCGT 7440 

TTTGATGATT TGTAAAGCTG GACGCACAGT GTCGCCTGTT GAATGTGCTG CACCACTAAC 7500 

40 , 

TAAACCATCT GCTTTACCAG CATAAACAAG CATTGTACCG AAGTAGTTCA CATTGTTTAA 7560 

TAATTCTTGT GCTTGTTCTT CAGTCGCTTT ACCTTTACGT CGTTCAACAA ATGATTGAAC 7620 

TAATTCAGCT TTCAATTCAC TTGTCGCAGG ATTAATTAAT TCAATATTAG AAATATCAAG 7680 

45 

ATCAAGTTTT TGCGCTAAAG ATTGAACCTT AGTCTCATCA CCTAACACGA TTGGTGTAAC 7740 

ATAATCTGTT GCTTGTAATT GTGTTGCAGC TGTTAGAACA CGTTCGTCCT CTCCTTCAGG 7800 

50 TAATACGATT TTAACGTTTT TACCAGAAAG TTTGTCTTTT AATACATTTA ATAAATCAGC 7860 

CATAATGTCC TCCTGTAATA TAAATCTTAT TAATCATTCA CGGTATAATT ATACGCCATT 7920 
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TATGATAAAA TTTATAAAGA ACTGATGATT 
CAGCCGAAAC ATTAGATGGT TGGTATAGTC 
5 CATTACGTAT AGTTCCAAAG GACGAACGCG 
TAGAAAATAC AGCAACTGTA AGATCATCAA 
CTGGTCAAAA AGCAGATTTG TTATTATGGT 

10 

ATATTGAAAA TG AATTTAAC AAATTGCGCA 
ATGTATCAGT CATTGAATTG AGCAATTATT 
AGAACCCTCA TATCAAAGCA AGATTATACC 

15 

TCTATCCAAT GAACAAACGT CGTAATGAAA 
AACGCCAAAA ATTAATGTAT GACCATGGTA 

20 AACAATTTAT TACTGGTTCT GTAGGGTTTG 
CAGATGACGT ATTACAATTC AAAAAAATTG 
CACGATACGG TGAATTCGGT AGTTTCTTTG 

25 ATCAATTCTT TGCGATTTCT TAATACATTG 
AGCTTATCGG TTTAAGCTTG GAATTTTTCG 
GACGTGATTT GGTAAATAGT TGAAATCTGT 

30 ATTATCAATA ACAAAGtACA CTTTGCTCAT 
GAACTTTAAC TACTATCACT ACATATAAAC 

ACTCTATACA ATTTTTGTAA TGGTTAACTA 

35 

AACATATTTT TGTCGAATTT TTTTCAATAA 

AACTACTAAA AATTCCGATG ATTATTATTA 

CAATAACAAC TTATCAAAAA GCTCATGTGG 

40 

ATTAAATTCT TATAAACAAT GGTGATGAAA 
AGGTACTTAT CAAAGACGTT GTCATGCTTG 
AAGGTACGCG TGTAGAAGAT ACCATGACAC 

45 

GTAACAGCTT TGTTACAAAC ACTGTCATCC 
GAATATTTAG AATTACCTCT CGAGATACAA 
SO TTTCGCGTCA AATTACAAAC AATGAAATTT 
AAATATATGT TGCTAAGCGT GACAGCAGTC 
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TTTGAAAAGG 


AGCGATAAAC 


ATGAGTCAAG 


8040 


TACATTTATT 


TTATGCAGTT 


GATTGGGCAT 


8100 


ATGCACTTGT 


CACTGAATTT 


CAATCATTTT 


8160 


AATCTGGTGA 


TCAAGCTATT 


TATAATATAA 


8220 


TCTTACGTCC 


TGAAATGAAG 


TCTTTAAATC 


8280 


TTGCTGACTT 


CCTAATCCCT 


ACATATTCAT 


8340 


TAGCTGGTAA 


ATCTGATGAA 


GATCCTTATG 


8400 


CAGAATTACC 


ACATTCTGAT 


TATATTTGTT 


8460 


CTTATAACTG 


GTACATGTTA 


ACTATGGAAG 


8520 


TGATTGGTAG 


AAAATATGCT 


GGCAAAATCA 


8580 


ATGATTTCGA ATGGGGCGTA ACATTGTTCT 


8640 


TATACGAAAT 


GCGCTTTGAT 


GAAACAACAG 


8700 


TAGGACATAT 


TATTAACACA 


AACGAATTCG 


8760 


GTACGTTTAT 


AAATTAATAA 


AAAAATTCCA 


8820 


TTTATCTTCA 


GTATATTCCC 


GTATACATAA 


8880 


ATGTTTAAAC 


TTATATATAT 


GTGCTAATGT 


8940 


AGCAAgTsaC 


CCGAgTAGTC TTCCTTGGGA 


9000 


GTTAACCTCA 


ATAGAAATTA 


TACAGTCGCT 


9060 


ATATTATTTT 


AACCTATTTG 


AAATATTTGA 


9120 


TTTTTCCTTT 


TTATACTTCA 


AGAGAATTTT 


9180 


CAATAGTATC 


AAATATTAGT 


TTTTTAAAAT 


9240 


TTATTTTATA 


GTGTATAAAC 


TATAATGAGT 


9300 


TGGACATAAA 


TTCAGAAGAA 


TACAAACAAG 


9360 


CTGCTCGCAT 


ACTATTAGAA 


TCTGGTGCAG 


9420 


GTATTGCAAA AAAACTTGGT 


TACAGTGAAA 


9480 


AGTTTACGTT 


ACATTCGGAA 


TCGTTTCCTA 


9540 


ACTTAATAAA AATTTCTCAA 


GCTAATAAAA 


9600 


CTTTAGCCGA AGCAAAAACG 


CAACTTGAAA 


9660 


TTCCCTTTAA 


AGGTTTTGCT 


GCAGCAATGA 


9720 
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TAGCAGGTAG TCTAGGATAC CTAGTCACTG AGATTTTAGA TCGTAAGTwA CACGCACAGT 
TTATCCCAGA ATTCaTTGGT TCaTTAGTTA tTGGGATTAT CGCCGTTATT GGACATACAC 
TTATTCCAAC AGGTGACTTG GCAACTATTA TCATTGCGGC AGTCATGCCT ATTGTTCCTG 
GTGTATTAAT AACAAACGCA ATACAAGATT TATTTGGTGG ACACATGTTG ATGTTCACAA 
CGAAATCATT AGAAGCATTG GTTTnGCGTT TGGCATCGGT GCTGGCGTTG GTAGCGTATT 
AATTTTAGTA TAGGAGTATC AGACTATGTT TTGGATCTTA AACTTTATCT TTAGCTTTTT 
AGCTTC 

(2) INFORMATION FOR SEQ ID NO: 244: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 2022 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



9840 
9900 
9960 
10020 
10080 
10140 
10146 
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(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 244: 

ATTTAATTGG TTGGTGGCGT ATTCTCnTTT CCAAGATTTG CCACGATTGG ATGTTCAGTC 60 

GACAAATATG TAACCAGTCC CGATAAATTA CGTTCCTCAA TCATTGATAG TATGTCTGGT 120 

GTTTGTAACG ATTTATCGAG TAAGGCATCA AGCAATTGAT AATGTCCCAA TACAACAAAA 180 

TGCACGTTGT CTCTCAACTG CTGTTGAATA AACTGAATAA AGAGCTTTAA GCTCTGTTGC 24 0 

ACATTCGCTA ATGATGGTGC ATAGTTTTCC AAACCAACTT GTACAGCCGC TTCATTATTC 300 

CGAATGATTA AACCTGTGTA TGCCACTTTT GTTGCTGCAG TTGGATACAT TGAGTAATAA 360 

CGCAATAATT GATCTGTAAA ATCATTTCGA AGTGCATAAA TTTGATGCTC ATGTTGCCAA 420 

AAATffrCGCT CACCCATCTG CTgCAAATCC TCATGGTTCA ATTGTTTCCA GTCCAACTTT 480 

TCAACCACAC TAAAATCAAC TAACTCATAA TCCGCTTTAT TAAAATATTT TAAAAATGCT 54 0 

GTTTCCGATT CTTTTAACGC AATTAATTGT TCTGnATTAT TCACTCGACC ACCCTTTACT 600 

TTCAATACTG TATTTAAAAT CACTTGGTAT TTTCGTTGTT TGCTTTACTT CTCTACCACG 660 

CTAAAGTGTA ATATGATTAA TAACTTATCA TTTTTAGCAA TACATTACAA CCTTTTTCAG 720 

AAAATTCGGT GTATTGATTT TAAAATTTTT TAAAATAnAA AAGGCAAGAC ATTTGTGCCT 780 

ATAAAAATGC TTAACCAAGA TTTTTATATT GaAGTTGTAC TTCTTGCACA TATTGTCCTT 840 

GCCTTATTAT GTAAAGTTAT TTTCTTTCTA TCTTTTTATT AAATTTAACT ATTCTTCATA 900 

ATCCCGATTC CCTTTAAAGT AACGTCTATC TTGTTTACTA TATACATTTT CAGGATTAAA 960 
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TTGGTAAACG TTCGTTGCTG ATATATCTGT AAAATTGTTT GGACCGACAC CTGCAATAAA 1080 

CTTAAACTCT GCTTCATCTA CCAAATAATC ATACGCTTGT GTATGTCTAT CCTGTGCGCC 114 0 

ATGTGGAAAT ACAAACATAT CTGTTTTACC TACAATTGGT TCAACTTCAT CTTTCCATCT 1200 

TTTAGTATCA CGTTTAATAC CTTCTAAAGA TGTTTTTTCA AAATTAATGT GACCATATGA 1260 

ATGACTCGCA AATGACCATC CATCCCGTTT CATTGCGCGA ACAACTTCCT CAGCTGCCTT 1320 

TTTATTCTTT GTATAATCTT TACTCGTTAA TTCATTCGTG CGATAACCTA ATACGCCCTC 13 BO 

ATAACCGGTT- AAAGCAACAA CACCTTTTTC ACCATTTAAA GAAAAATCTG GATGCTCTTT 144 0 

TACAAATTTA TTTAAAATTG GCACGATATC ATTGTCATCA GAATAAGTAG CATGGCCTTT 1500 

TTTGTCTGTA GTTTCAGAAA CAACATGTTT ATTTTTATCG AGTACTAAAC GGTCAGCATA 1560 

ACCATGGTGT CTCATGTAAC TATAGTAATT CATATCATCA ATTGAGATGA TTAGTGGCTT 1620 

20 TTTACCTTTC GGCAATTTTA TTTTTTTGGC TTTTACATGA TGAGATGATA AGTCGTATAC 1680 

ATCATGTGGA TTAACGATGA TGTAATTATT TTTATATAAT TCGTTCAATG ATTTTTTAAA 1740 

TTCACTTACA GTAATCATCC AATCATTGTT GCCCTTAGCT TGGTGTGTAT CTCCTGTAAA 1800 

25 CGCAACTTTT GGGTCTGTAA TTAATGGGTG ATAAAACACA TGATAAACTT GGCCGTGATA 1860 

TGTTTCCCAA TGTTCATCCA TTTTcGATTT aTGCTTTGCA TACTCATTTG GATTAACAGA 1920 

TTTATTJtTGA GCTTTCTCAT TTTGCTTGGA ACAGCTATAT mACAATGCAA CTGATAATAA 1980 

30 

CAGAAAAAAT AG CAATAAAT ATTTTTTATG CATTAAACAT TC 2022 

(2) INFORMATION FOR SEQ ID NO: 24 5: 

(i) SEQUENCE CHARACTERISTICS: 
35 (A) LENGTH: 1340 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

40 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 245: 

ATAGAGTGAT AAAGGATGGT TGTCATATGA TAAATGCAGT AGTAATAGCA GTAATTTTAA 60 

45 TGATTGTGCT ATGTTTATGT CGATTAAACG TnTTATTAAG CTTATTTATC AGTGCGCTAG 120 

TTGGTGGCTT AATTTCAGGC ATGAGCATTG AAAAAGTTAT AAATGTATTT GGGAAAAATA 180 

TAGTCGATGG TGCTGAGGTA GCATTAAGCT ATGCTTTATT AGGTGGATTT GCAGCATTAA 24 0 

SO TTTCATACAG TGGTATCACA GACTATTTAG TAGGAAAAAT TATAAATGCA ATTCACGCTG 300 

AAAATAGTCG ATGGTCAAGA GTTAAAGTCA AAGTGACAAT AATCATTGCA TTATTAGCTA 360 
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CACCATTGTT 


AAGTCTGTTT 


AATGACTTAA 


AAATAGATAG 


ACGTTTAATC 


GGTTTGATTA 


480 


TCGGTTTTGG 


TTTATGTTTC 


CCGTATGTGT 


TATTACCATA 


TGGATTCGGT 


CAAATTTTCC 


54 0 


AGCAAATTAT 


TCAAAGTGGC 


TTTGCAAAGG 


CAAATCACCC 


AATTGAGTTT 


AATATGATTT 


600 


GGAAAGCAAT 


GCTTATTCCT 


TCAATGGGGT 


ATATTGTTGG 


CTTACTTATC 


GGTTTATATG 


660 


TATATCGTAA 


ACCACGTGAA 


TATGAAACAC 


GTAAAATTTC 


AGATAGTGAC 


AATGTTACAG 


720 


AGTTAAAACC 


ATATATCTTA 


ATAGTAACAA 


TTGTAGCAAT 


ACTAGCTACA 


TTTTTAGTAC 


780 


AAACATTTAC 


AGATTCAATG 


ATTTTTGGTG 


CACTGGCAGG 


GGTACTCGTA 


TTCTTTATTT 


840 


CACGTGCATA 


TAATTGGTAT 


GAATTAGATG 


CTAAGTTTGT 


TGAAGGTATT 


AAAATTATGG 


900 


CTTATATTGG 


TGTAGTTATT 


TTAACAGCAA ATGGATTTGC 


TGGTGTAATG 


AATGCTACTG 


960 


GTGATATAGA 


TGAATTAGTT 


AAAACTTTAA 


CAAGTATTAC 


TGGTGATAAT 


AAATTATTTA 


1020 


GCATTATCAT 


GATGTATGTG 


ATAGGTTTAA 


TTGTCACTTT 


AGGTATTGGA 


TCATCATTTG 


1080 


CAACAATTCC 


TATTATCGCA 


TCATTATTCA 


TTCCTTTTGG 


AGCGTCAATT 


GGACTAGATA 


1140 


CAATGGCATT 


AATCGCATTG 


ATTGGAACAG 


CGAGTGCATT 


AGGTGACTCA 


GGTTCGCCTG 


1200 


CAAGTGATTC 


AACATTAGGA 


CCAACTGCGG 


GATTAAATGT 


TGATGGCCAm 


CATGATCATA 


1260 


TACGTGATAC 


ATGTGTACCA 


AACTTCTTGT 


TTTATAATAT 


TCCTTTAAAT 


GATTTTCGGT 


1320 


ACTATTGCTG 


CTATGGTACT 










1340 



30 (2) INFORMATION FOR SEQ ID NO: 246: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 3365 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



* (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 246: 

40 



45 



50 



CAAAATCTAA 


GAGAATAAnA 


TTTGTTAATT 


TnAAATAGCA 


AGCAATTCAA 


AGTTATATGT 


60 


GTAATAGATA 


AAATAGATAT 


CCCTATAGTG 


ATGCGTTACT 


AGCTAAACAT 


AATAACACAT 


120 


TAGAAGATAA 


TGAAGTTAAG 


GAGTTACTGG 


ATTGTTTCGA 


CTATGTAATT 


AAGTATAAAA 


180 


ATATCCAACG 


ACAAAACGTA 


ATTATAAAAT 


GGTAAAAGCT 


ATGGTACAGT 


TTCAAATTGC 


240 


TAATGACATG 


CGTATCGGTG 


AGCTACTTGC 


AATAAAGAGA 


GTAAATATAA ACTATGAAGA 


300 


TAAAACGCTA 


GATATCGACG 


GTAAAGTTAA 


TTGGATAACT 


GAAAAAAGAC 


GGGAGCATTC 


360 


GGAGTAAAGG 


AGACAACTGA 


AAGAAGTAAT 


AGCTATAAGG 


CCACAGGGCT 


CACTACCCAA 


420 
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TATTCACAAA TACGTCTGGT AGCCCTATCG 
GGGGGCGCTG ATATTAGTTC TATTAAGAAA 
5 CATATATCTA CACTTGCTCA ATTAGGAATT 
CATTCAGATT ATAAAArAAA TCTAGAGATA 
GATATGATGA ATAAATTTGA ACGATTGGGG 

10 

CAGAAATTAA GCCTATGCTC AATTTTGATG 
TATTTTTTAA TATTATTGAC ACCGAAAAAG 
TCTTCAAACT wGcTTATTTC CGaAAAAATT 

15 

AATTTGCTTA TTTATCAGAT TTAGCAACTA 
ATTTAACTTT AGATATTGAA CATAGTTTAA 

20 ATAACCAAGA AGATGGTTAT AAAATAATAG 
GCAATTCAAA TTTTGACACA AATTCAAGAA 
AAAATAAAAA CGAAATATTC AAGCATATGA 

25 ATAAATACTA TCmAAATCCA CCCGCnnGGk 
TCGTTTCGTT TCTCAACTTC TATTACAAGA 
ATATTTTAAT GCCTTTAGTT AAAAATATAA 

30 TAGCAAATCT AAATTATGAC AGTAGATTAC 
TAGGCATATC TAGAAACATG TTCGGAATAA 
AATTACATAA TCAAGTTTGT AGTAATGCAA 

35' 

AACTTCAAAA GCGATATAAA AGrAACGrAA 
GATTTTTTAT AGCTTTAGAT AAAATTATTG 
AGTGAGGAAA GAGACTTATA GGTCTCGCGA 

40 

GAGCTATGCA TTTTATTTAA AATGCGTAGT 
TTTTGCAATA TAAACATATC TTTGTGCAAA 
TTTtGCCCTT TTTCTATACC CCAAAACACA 

45 

TTGACAATAA ATTATATATT ATTGTTCTTC 
AGAACGTTTG ATAGCTGTAG TCAaCATACG 
50 ACGTGGTAAA ATTTTACCGC GTTCTGAGAT 
GTCGATATGT GTAATACCAT TTGCTGTGAA 

55 



ACTCGAACAA AATTAGCCAC ATTATTAAAG 54 0 

CCTATAACGA CGCATACATT ACATCATTCG 600 

AACTTAAAAG CAATGCAAGA GCATGTAGGT 660 

TACACACATG. TTACTAATCA GATGGCGAAA 720 

AGTTAAAATT GGAAAAAGAT GaTACACTAG 780 

AGCAAATAGC AAAATTAAAA CAGATGAATA 84 0 

CAAATGAAAT TCTTAGAAAA AATAATTACT 900 

TCGrAAAAAA GaATGGCGGC TATTTCATAG 960 

TAGATATGaA ATTAAGATAC ACAATGTTGC 1020 

AGTATCTAGT CTTAAAACTA ATAACAGAAA 1080 

ATGAGTTCTT ATGTATTGaT AAATCATATA 114 0 

CACCAGAAGA AGTTATGGAA ACCAAAATCA 1200 

ATAAACGAGG ACAACTACCC GAGAAGTTGa 1260 

TTTGCaTTGr ATTCATGCAA CTAGGTCAAT 1320 

AGTACAATGA CGAAGAATTG AGAGTTGCTA 1380 

GAAaCAAATC AGCTCATAAC CAACCCATCA 1440 

CTCAATATTT ATTTGAAAAA GGGAATAATA 1500 

AAAATTTCAT AGATACTkTC ksTACGCTAG 1560 

TTATCCAAGC AAGATATCAC GATTTGGACC 1620 

GCTATTATAA TAATGCATTA GCTATCAAAA 1680 

ACTTCAACAG ACCAAAAGTA TAAACTATCT 1740 
GTTATTTTAA TTCGTATGCA AGAAAAAGAA ' 1800 

TCTTtTTTTA TGCATCTAAA TTCATATTAT 1860 

TTCCGAACAC AAAACATTCA CATCATCCTT 1920 

AAAAGCCCCG TAAGCCTATG CcTACGGGgT 1980 

TTTAACATAT GGTAATAATG CCATATGACG 2040 

TTGATATTTA GCTGAAGTAC CAGTTACACG 2100 

AAAACGTTTT AATAATTCAG TGTCTTTGTA 2160 

ATAGCATACT TTTTTACGAC GACGTCCGCC 2220 
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CGTTAATTTT 


TATTAGAATG 


GTAAGTCATC 


ATCACTTATA 


TCAATCGGTC 


CGTTTGCATT 


2340 




TGCAAATGGA 


TTATCAGATT 


GTTTCGTGTT 


TGATGAATTA 


TTGTACGAAT 


TGTTTTGTCC 


2400 


5 


TGATTGTTGA 


CCACCGAATC 


CTTGACCGTA ATCTTGGAAT 


TCATTTTGTT 


GACGTTGGCC 


2460 




ACCATTTTGT 


TGCGCATTTT 


TAGGTTCAAG 


GAATTGAACG 


CTATCACACA 


CAACTTCAGT 


2520 


10 


AACAAACACA 


GGACGACCTT 


CTTGATTTTC 


ATAATTACGG 


GATTGTAAGC 


GACCATCTAC 


2580 


ACCAGCTAAA 


CTACCTTTAG 


ATAAATAGTT ATTTACATTA TCTGCTTGTC 


TTCTAAAAAC 


2640 




AACACAGTTA 


ATAAAATctG 


CtTCGCGCTC 


CCCTTGAGCA 


TTCGTGAACG 


TACGATTTAC 


2700 


15 


TGCAAGAGTG 


AATGtCGCTA 


CACTCACACC 


TGAGGGAGTG 


GTTCTGTATT 


CCGGATCTTT 


2760 


CGTTAAACGA 


CCTACTAATA 


CAACTCTATT 


TAGCATTTAA 


ACGCCCCCTC 


TAATTATTAC 


2820 




TTGTCTTCGT 


CTTCACGAAT 


AACCATGTAA 


CGAATGATAT 


CGTCACTGAT 


TTTAGCTAGA 


2880 


20 


CGTTGGAATT 


CGTCAGTAGC 


TTTGTTGTTA 


TCAGATTTAA 


CACGTACGAT 


GTTGTAGAAG 


2940 




CCATCTTTGA 


AATCATTGAT 


TTCATAAGCT 


AGGCGACGTT 


TACCCCAGTC 


TTTTGCTTCT 


3000 




AAAACTTCTG 


CACCTTCAGT 


AGCTAAGATA 


CCGTTGAAAC 


GTTCAACTAA 


CGCTTTTTTA 


3060 


25 


GCATCTTCCT 


CAATGTTTGG 


GCGTACGATG 


TACATAACTT 


CATATGTTCT 


CATTTTATAT 


3120 




TTGCACCTCC 


TTGTGGTCTA 


TACGGCTTAT 


CAATCTTAAA 


ACAGATAAGC 


AAGGaATAAT 


3180 




TTTCATTACT 


CACAATAAAG 


AATTaTATCA 


TGCGCCATTA 


CTTTTTACAA 


TaATAATTcA 


3240 


30 


AACTACTCTT 


CATATCATTT 


TTGATATtAA 


TTCATTTGaA 


ACTTTCnATG 


ATATTTTnAA 


3300 




AAATACACTT 


CACAAAAGCG 


AACATATGTn 


CTATAAnAGT 


TGTGAGGTGG 


TAAGGAATGA 


3360 




ATTTA 












3365 



(2) INFORMATION FOR SEQ ID NO: 247: 

4i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1032 base pairs 

(B) TYPE: nucleic acid 
40 (C) STRANDEDNESS : double 

(O) TOPOLOGY: linear 

45 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 247: 

GTTAAAAGTA ATTGGTGGTA TTGATGATGA TTTTACAGCC AATGTTATGC ATCCAAATCA 60 

ATATCGAATT CGATATTCGT CTCAGAAACA GGACCTTAAT GAAGATATGA CAGTTTTTGA 120 

50 TGCAGTATTA AGTTCTGATA CAACAACTTT ACGCATCATC AAGCAATATG AGCAGGCAGT 180 

ACAAGCTTAT GCGGATGACC AAAGTGATAA ATTGTTCAAG CGAATGATGG ATGCGCAAGA 24 0 

55 
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ACTAGGTATA CATGATACTA CTAAATACAT TAAAGAATTA TCCGGCGGAC AACAAAAACG 360 

TGTTGTACTT GCTAAAACAT TAATAGAACA ACCAGATTTA TTGTTATTAG ATGAACCTAC 420 

5 

GAACCATTTA GACTTCGAAT CAATCAGCTG GTTGATCAAT TATGTGAAGC AATATCCTCA 48 0 

TACTGTTTTA TTCGTAACCC ATGATCGATA TTTTTTAAAT GAAGTTTCCA CTAGAATTAT ' 54 0 

TGAACTAAAC AGAGGTAAGT TAGCGTCATA TCCTGGTAAC TATGAATCTT ATATTGAAAT €00 

10 

GCGCGCTGAA AGAGAAGTAA CACTTCAAAA GCAACAACAA AAGCAACGAG CTTTATATAA 660 

GGAAGAACTT GCTTGGATGA GGGCTGGgAG CTAaGGCTCG TACTACAAAG cAACAAGCTA 720 

GAATTAATCG ATTTAATGAC CTAGAmAATG AAGTTaACCA GCAATATAAA GACGATAAAG 780 

15 

GTGAATTGAA TCTTGCTTAT TCaAGATTAG GTAAGCAAGT GTTCGAATTA GAAGACTTAT 84 0 

CAAAGGCTAT TAATGATAAA GTATTATTTG AACATCTGAC GGAAATTATT CAAAAmGGTG 900 

20 AGCGTATTGG TGTTGTTGGG CCAAATGGAG CTGGTAAAAC AACACTCTTA AATATTTTGA 960 

GTGGAGAAGA CCAACAATTC GAAGGTAAAT TGAAGACTGG GCAGACGGTT AAAGTAGCTT 102 0 

ATTTTAAGCA AA 1032 

25 (2) .INFORMATION FOR SEQ ID NO: 248: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 852 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
30 (D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 248: 

35 

TGTGATTAAC GAAGCTTATT TTCGTACACC TTCAACAACT GATTACAACG GCGTTTATCA 60 

AGGTTATTAT ATTGATTTTG AAGCAAAGGA AACTAAAAAC AAGACGTCCT TTCCTTTAAA 120 

TAATATTCAT GACCATCAAG TCGAACATAT GAAAAATGCA TATCAACAAA AAGGTATTGT 180 

40 

GTTTTTAATG ATTCGTTTTA AAACGCTAGA TGAAGTTTAT CTTTTACCCT ATTCAAAATT 24 0 

CGAAGTATTT TGGAAGAGAT ATAAAGATAA TATTAAAAAG TCTATAACAG TTGATGAAAT 300 

ACGAAAAAAT GGTTACCATA TTCCTTATCA GTATCAACCA AGATTAGACT ATCTAAAAGC 360 

45 

. AGTTGATAAG TTGATATTAG ATGAAAGTGA GGACCGCGTA TGACGGAAAA CAAAGGATCT 420 

TCTCAGCCTA AGAAAAACGG TAATAATGGT GGGAAATCCA ACTCAAAAAA GAATAGAAAT 480 

SO GTGAAGAGAA CGATTATTAA GATTATTGGC TTCATGATTA TTGCATTTTT CGTTGTTCTT 540 

TTACTAGGTA TCTTATTGTT TGCTTATTAT GCTTGGAAAG CACCTGCTTT TACCGAAGCT 600 
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TTAGATAATG GCCAAAGACA TGAGCATGTA AATTTAAAAG ACGTGCCGAA 



ATCAATGAAA 



720 



GACGCAGTAC TTGCAACTGA AGACAATCGT TTCTACGAAC ATGGCGCACT 



TGATTATAAA 



780 



CGTTTATTCG GTGCAATTGG TAAGAACTTG ACTGGTGGAT TTGGkTCtGA 



AGGtGCCTCA 



840 



ACATTAACAC AA 



852 



10 



15 



20 



25 1 



30 



35 



40 



45 



50 



(2) INFORMATION FOR SEQ ID NO: 24 9: 

(i) SEQUENCE CHARACTERISTICS: " , 

(A) LENGTH: 5B04 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 24 9: 

CACTTTTTTC ATTAAAAATC TCATATTTAT ACACTGAACG TAATCTCGAA TATTTTTCAA 60 

CCCAAGTTTT AACTTTAACT TTTTCTGGAT AAAAAATAGA CTTTTTATAA TTGACATTGA 120 

GGTCAGTCAC AGGTGAAATG ATTCCTTGTT TTTCCATATC AGCATAACTA AAACCTAACT 180 

TCGATATATA ATCCAACCGC GCAACTTCAA ACCAAGTTGC ATAATTCCCG TGATAAATTA 240 

CACCCATCTT ATCAGTTTCA GCATAACGCG CTTCTATTTC TGTAATACTA TATATCATTT 300 

TAAGCCTTCT TTCAGTTTAA CTTTATATCT CATTCTAACA TAAAATACAA GAAGAGGCCG 360 

GCCAAGAACA CAAAGGkTTT GAACCGACCT ATTATATCAT AAaGTTTATA GAAGTATTTT 420 

TGAGCACTAT CAAAGTGCCT CAAATACCGA TTAAAATTTT ACTGTGATAT CTATTTTTTA 480 

TTGCGCTAAT TTATTTCTTA AAACCATTTG TAAAATTCCA CCGTGACGAT AGTAATCCAT 54 0 

TTCAACAAGT GAGTCAAAAC GAACCATAGC GTCAAATTCT ACCAAATCAC CATCTTGCTT 600 

CTTA0CAGTA ACTTTGACGT AGtCATGTGG TTGAACATTT TCATCAATAT TAACAGrAAT 660 

TTCTTCTGTA CCATCTAGAC CAAGAGAATC AGCTGATTCA CCTTTTTTAA ACTCTAATGG 720 

TAATACACCC ATCATAACTA AATTTGAACG ATGGATACGT TCATAACTTT GTGCAATAAC 780 

TGTTTTAACA CCTAATAAGT TTGTACCTTT TGCTGCCCAG TCACGAGATG AACCCATACC 840 

ATAATCGTTA CCAGCTAATA CAACTAAACC TGTACCATCT TCTTTATATT TCATTGCAGC 900 

ATCAAAGATA GGCATTACTT CATTTGTTGG CCAATAAGTT GTAAAACCAC CTTCAGTACC 960 

TGGCGCTAAT TGGTTTTTAA TACGTATATT AGCAAACGTA CCTCGAACCA TTACTTCGTG 1020 

ATTACCACGT CTTGAACCAT ATGAATTAAA TTCACGAATA GGCACTTGAT GATCTTGTAA 1080 

ATATTTACCA GCTGGCGTAT CTTTACCAAT TGCACCTGCT GGAGAGATGT GGTCAGTTGT 114 0 
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TTCTTTAGAT AATCCTTGGA AGAATGATGG ATTTTGAATG TATGTTGAAT TAGGATCAAA 1260 

GTCATATAGA GGTTGATCAG TTACATCAAT CTCATTCCAT AATTCGTTGT TATTGTATAC 1320 

5 

GTTATTATAT TCTTCAATAA ATAATTCAGG TGTTACAACA CTATCAACGG TATCTGAAAC 1380 

TTCTTTAATT GATGGCCAAA TATCTTTCAA ATATACATCT TCACCGTCAT TACCTTTACC 1440 

AATAGGTTCA TTTTGTAAAT CAATATCAAC CGTTCCAGCT AATGCATAAG CAACAACTAA 1500 

10 

CTGTGGTGAA GCTAGGTAAT TGGCTTTAAC AAGAGGATGG ATACGACCTT CAAAGTTACG 1560 

GTTACCAGAT AATACAGATG TCACTAATAG GTCCTCATCA GCAATCGCTT TTTCAATTTC 1620 

is TGGTAATAAA GGACCTGAAT TACCGATACA AGTTGTACAT CCATAACCAA CCAAGTTGAA 1660 

GCCTAAATCA TCTAAATAAG GTTGTAAGCC AGCATCTCTT AAATATCCGG TAACAACTTT 1740 

TGATCCTGGT GCTAGAGAAG TTTTAACGTA TTCAGGAACT TTCAAGCCTT TTTCAACTGC 1800 

20 TTTTTTAGCA ACTAAACCTG cACCTAACAT TACATAAGGG TTAGATGTAT TTGTACATGA 1860 

TGTAATTGCT GCTATTGCAA TATCACCTGT TTTCATTGTA GCTTTTGATC CATCTTTAAA 1920 

GTTAATTTCA GCTTTCTTAT CAAATTCACT TTTATCTAAA CCGTGTCCTT GGTTGCCTGC 1980 

25 TGGAGCTGTT ACAGAATTTT CAAATGATGA TTTCATATCA CTTAAGAAAA TTAAATCTTG 204 0 

AGGACGTTTT GGTCCTGAAA GCGATGCTTC AACTGTTGAT AAATCCAATT CGATAACATC 2100 

TGTATAATTA GGATCTTCTT TCTCAACATC AAAGAACATA TGGTTTTGTT TCAAATATTC 2160 

TTTTACTAGC GCGATATGTT CGTCTGATCT ACCAGTTAAC TTCATATATT TAAGAGATTC 2220 

ATCATCAACT GGGAAGAATC CGCAAGTTGC TCCATACTCT GGTGCCATGT TTGCAATTGT 2280 

AGCACGGTCT GCTAGTGGTA AATGTTGTAC ACCTGGACCA AAGAACTCCA CAAATTTACC 2340 

35 

AACAACACCT TTTTTACGTA GCTCTTGAGT TACTCTTAAC GCTAAATCAG TTGCTGTTGC 2400 

GCCTTGTGGT AATGAATTTA CTAGTCGTAC ACCAATAACC TCTGGAATTG GGAAATAAGA 2460 

AGGTTGTCCA AGCATTCCAG CTTCAGCTTC AATACCACCA ACACCCCATC CTAGTACGCC 2520 

40 

AATACCATTT ATCATTGTTG TATGTGAATC AGTACCAACT AATGTATCTG GAAATGCAGT 2580 

TTTTTCACCA TCTACATCAC GAACATGTAC AACACTTGCT AAATATTCTA AGTTAACTTG 2640 

GTGAACTATT CCAGTTGCAG GAGGAACTGC ATTGTAATTA TCAAATGCTT TCGTTGCCCA 2700 

45 

ATTTAAAAAC TGATAACGTT CATAGTTACG TTCAAATTCT AATTTCATAT TACGTTCAAG 2760 

AGCTTCTGGA TTTGCATAGC TATCCACTTG AACTGAGTGG TCAATAACTA AATCCACCGG 2820 

50 TACTTCTGGA TTAATTTTAG TAATATCTCC CCCAACGTCA TCCATTGCTT TACGTAAAGA 28 80 

AGCTAAATCA ACTACGGCTG GTACACCTGT GAAATCTTGT AAAATAACAC GAGAAGGTTT 2940 
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GTCTGTAATT ACAAAATCAT CTTCTTGACG AAGTAAAGAT TCTAACAAAA CACGAATTGA 3060 

ATAAGGTAAA TTGGAAACTT TAGTAATACC TTGCTCTTCT ACAGCTTTTA AATCATAGTA 3120 

5 AGTATAACTT TGGCCATTCA AGTCAAAATG TTTTTTTGAT TGCTCTTTAA AATTTGCAGC 3180 

CATTTAATGA TCCCCCTTGA TACATTTTTA TATTTATATG CCTTGATTAA ATTGTATTAT 3240 

TATATTTATT GATAAACAAC TCATCATGCT TAGAAAACGC TTAATTTAGG TTTTGACTTT 3300 

10 

TTAATCAGAG TATATAAGCA AAACTTATCA TACAGGTAAG GTGTAATAAG TATTTTTTAT 3360 

TAATTGAGAA TAATTATCAA TTTCGCGAAT GATTCAATTC AATTTTTAAA CGTATTATTT 3420 

CATTGAGCAG AAAGAAAATT ATGGCACCAA ACTTTAATAT TTTTTTCAAT GTCATTCTTT 3480 

1S 

TGATGGGAGT GGGACAGAAA TGATATTTTC GCAAAATTTA TTTCGTCGTC CCACCCCAAC 3540 

TTGCATTGTC TGTAGAAATT GGG AATCCAA TTTCTCTTTG TTGGGGCCCA TCCCCAACTT 3600 

2Q GCACATTATT GTAAGCTGAC TTTTCGTCAG CTTCTGTGTT GGGGCCCTCA CCCCAACTCG 3660 

CATTGCCTGT AGAATTTCTT TTCGAAATTC TCTGTGTTGG GGCCCCTGAC TAGAATTGAA 3720 

AAAAGCTTGT TACAAGCGCA TTTTCGTTCA GTCAACTACT GCCAATATAA CTTCGTAGAG 3780 

25 CATAGAATAT TGATTTATGT CCCAGCCTGA GTTAATTTTC TATAAAAGTA TATTTAATTT 3 840 

GCGTTTATAC CGTCAAACTT CACTTTAGCT TTGTCAAACC CCTTTCTATT AAGTTTTCAG 3900 

AAATAAACCT ATCTTAAAAT ATAAAAAAAT CGAGAATTCG TAGTTTAATA ACGAAATTCT 3960 

30 CGTTCTTATC CTTTTGAATA TACTCAATTT TCCACAAAAA CAAACAAGTA GTATATCTGT 4 020 

TCTAGCTACT AGAATGACAT ACTACTTGTT ATTAAAATAC TTAACTAAAC TTTATTAGTT 4 080 

ATCTTTTTTC TCTATATTTC TACGTGACTG ACGCTTTTCA AGAATGTCAG ATTCATAATC 4140 

35 TTCTTGTTGA CTCTTGATAT ATTCTTGTAA GCGATGTTTA TTCGGAGTCA ATGTTAAACC 4200 

TAGGAATTTA CGTTCCTGGT TCGCATCCTT GTAGAAACTT ACCATCATGA GTATGACGAC 4260 

AAAGGAGAAT GGGAATGCAC TTATAATTGC AGCACTTTGA ATCGCATTTA AAGCTTCAGC 4320 

40 

GCCGTTACCG CCACCAGCTA ATAAAAGTAC AAATGCTATT AAGGCCTGTG AAATTCCCCA 4380 

AACAACTTTT AC CAT ACT AG ATGGATTTAA TGAACCAAAT GTTGTTTGCA TTCCTAATAC 444 0 

AAATGTTGCT GAGTCAGCAG ATGTAATAAA GAATGATGCA ATTAATAATA ATGCAATCAA 4500 

45 

CGATAAAACA ATGCCAAATG GCACATGATT AAACACTCCA AATAGCTGTG TTTCAGGAGT 4560 

CATATCAAAA ATTTCTTTGT GTTTCTTACC TGTCTCGATG CCTAATACAC CAAAGACACT 4 620 

50 AAACCAAACA AAACTAACAA TTGCTGGAAC TAGCAAGACA CCAGAAATGA ACTCTCTAAT 4680 

TGAACGTCCT TTTGAAACTC GTGCAATAAA CACTCCAACG AATGGACTCC AACTTAACCA 4740 
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TGCTGTATCA AAACTATTAA ACAAGAATGT GTTTAGTAAA CTACCCGTAG AGCTAGTTAA 4860 

CATATTTAAA ATAAGAACAG TTGGTCCAAC AATTAAAGCA GCTACCATTA AAATAGTACC 4920 

5 TAAACCAATG TTCAAGTTAC TTAAGTATTG AATACCTTTA CTTAATCCAG ACCATGCACT 49B0 

TGCTATAAAT AAGATAGTAA CAACAATGAT GATAATCGCT TGTACAAACG TATTGTTTGG 5040 

AACATTGAAC AAGTAATGTA AACCACCATT AATTTGTAGA GCACCCATAC CTAACGAAAC 5100 

10 

GGCTACCCCA ACGATTGTCG CAAATACAGA TAAAACGTCA ATAAAAATCC CAATAGGACC 5160 

TTCTACTTTA TCACCTAAAA GAGGACGTAA AGTTCTAGAT AATAAACCTG GTTCACCTTT 5220 

ACGGAATTGC GAATATGCCA ACGTAACGCA ACAACACCAT AAACAGCCCA AGCATGGAAT 5280 

15 

CCCCAATGGA AAAATGTTGA ACGTAGAGCT TCAGTATAAG CTTCAGTAGT TTTGGGATCT 534 0 

GCTGTAGGTG GCGTAGCAAA GTGCGCCATC GGTTCAGCTG CACCATAAAA CACCAAACCT 5400 

ATCCCCATAC CAGCACTAAA CAACATAGCA AACCATGAAA TTGTATTAAA CTCAGGTTTG 5460 

20 

TCATTTGGTT TACCTAGTTT AAGTTTTCCA ATAGGACTAA AAATAAGGAA TATACAGAAG 5520 

AACACGATAA TCGTAGTAAG AATAAGATAA TACCAACCTA ACTTTTCTGT AATCCACATT 5580 

2s TTAATATTAT TGGTAACATA GTTGAATTGT TCAGGTAAAA ATGCACCAAG TAATACGACT 5640 

ATAGCAACAA CAATTGCACT ATAGATGAAG ACTGGTGAAT ACTTCTTTCC ATTTGGATTC 5700 

TCTGGTGAAG AAGAATTCAT AATTAATTAC TCCCTTCAAT TCTATATTTA ATTTTATGTA 5760 

30 GTAGAATAAA AATATTATCT AAACATTTTA TTCAATAACT CACG 5804 

(2) INFORMATION FOR SEQ ID NO: 250: 

<i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 400 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
r (D) TOPOLOGY: linear 



40 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 250: 

ACCCGCGAAT ATGGTCCATC CTATCGATTT ATTTTTAACT GGTTTGACAA TATTTAATTT 60 

TTCATAATCA TTCTTAGTGA TTTTGACATA TGTTTTCGGT ATGAGCCAGT TAATAAATGG 120 

45 

AAAGAAGAAG ACAATCCAAT TACTTGCCAA ATCaATCATT AAATATTCAC TATCGTATTT 180 

GATTATTCGA TATTTAGGGT TTTTATTAAT AACTTTAGAT TCGCAAAGCA ATGTCTCCAC 240 

so ATCCCTTTAA TTTTATGTGT AATACATTTT TCGATACTTC AAAAGACATT CAAATACTAT 300 

CAAGTTACTG TCATCAAAGG TTTTATTAAC TGATATTtTC ATATTTTTAa TCTGAATTTA 360 
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(2) INFORMATION FOR SEQ ID NO: 251: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 964 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



10 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 251: 



15 



20 



30 



CCAGGGTGCG 


GAAAGCTTTA 


AAATTTGGAC 


TAATAAAGAT 


GCTGATATTA ATTCTATGAA 


60 


AACAGCAGTT 


TTACAACAAT 


TAAAAGGAGA 


ATAACATATG 


CTTACTGGcA AACAAAAAAG 


120 


ATACTTAAGA 


AGTTTAGCAC 


ACAATATTGA 


TCCGATTTTT 


CAAATTGGAA AAGGCGGTAT 


180 


CAACGAAAAT 


ATGATTAAAC 


AAATAGATGA 


TACGTTAGAA 


AACAGAGAAT 


TGATTAAAGT 


240 


ACATGTACTA 


CAAAATAACT 


TTGATGATAA 


AAAAGAATTA 


GCTGAAACAT 


TAAGCGAAGC 


300 


TACTCATAGT 


GAATTAGTGC 


AAGTGATTGG 


ATCTATGATA 


GTGATTTATA 


GAGAATCTAA 


360 


AGATAATAAA 


GAAATTGAAT 


TGCCATAATA 


ATGAAAAAGA TAryACTTTA CGGCGGTCAG 


420 


TTTAACCCTA 


TCCATACTGC 


ACATATGATA 


GTAGCTAGCG 


AAGTATTTCA 


TGAATTACAG 


480 


CCAGATGAAT 


TTTATTTTTT 


ACCTAGTTTT 


ATGTCTCCAT 


TGAAAAAGCA 


CCATGATTTT 


540 


ATAGACGTTC 


AGCACAGATT 


AACAATGATA 


CAGATGATTA 


TCGACGAGCT 


TGGTTTTGGA 


600 


GATATTTGTG 


ACGATGAAAT 


TAAACGTGGT 


GGTCAAAGTT 


ATACCTATGA 


CACGATCAAG 


660 


GCATTCAAGG 


AGCAACACAA 


AGACAGTGAG 


TTGTACTTTG 


TTATTGGGAC 


GGATCAGTAT 


720 


AACCAACTAG 


AGAAATGGTA 


TCAAATTGAA 


TACTTAAAAG 


AAATGGTTAC 


TTTTGTAGTT 


780 


GTAAATCGAG 


ACAAAAATAG 


TCAAAATGTT 


GAAAATGCTA 


TGATTGCAAT 


TCAGATACCT 


840 


AGGOTAGATA 


TAAGTTCGAC 


AATGATTCGA 


CAAAGAGTTA 


GTGAAGGGAA ATCTATCCAA 


900 


GTTCTTGTTC 


CTAAATCCGT 


TGAAAACTAT 


ATTAAGGGGG 


AAGGATTATA 


TGAACATTGA 


960 


AAAA 












964 


(2) INFORMATION FOR SEQ ID NO: 252: 









(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 1193 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



so 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 252: 
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TTGTCATGAA 


ATAAATGGGA 


TGAATATCAC GACTAGAAGT AATGTTACGA ACAGGAGCGT 


120 




ATAAACTAGA 


GACGCTAAAT 


TCGACATAGT ATGTnGCTCA ATTATGGCTG ATGATGAATT 


160 


5 


TAAAGTATGT 


GCGTTGGAAC 


TGTCGGATTT TTGTTCATAA TGTTTTGCAT ATTGCGCCAT 


240 




GATGAATAGT 


GTAAAAATAA 


ATAAAACAAT AAGAGATATA ATGCCCATAA TCAAAAGTAT 


300 


10 


TTGTTTAGAG 


CCTTTCATTA 


TTTCACATCC TTTCTAAAAT ATATTTGTAA CTAAATTTAA 


360 


AATAGTTATT 


TTTGTAATTC 


TAAACCTTTT TCATCGCGAA AACAATTAAA TAGGTCGCGG 


420 




TATTAATTAT 


TATATTATTA 


CCGCTTAATA TGAAAAATAC ATGAaAATTA ATTTTCTAAT 


480 


15 


ATACTTTTGA 


AAAATTATTA 


CAAATTAGCC CCTTCAAAAC GCGAAAACAT AAGGATTCTA 


540 


GTTTCAAAAG 


GGCTGATAAG 


CATAAAATGA AATGTAATAT TTCGATGTAT AAAATTTTTA 


600 




ATTAGCTAAA 


AATCATCGCA 


TTAATTTTTT GAGCTACATC ATCAAAATTC GGACATTTTA 


660 


20 


ACGACACATA 


TAATTTAATT 


TTAGGTTCAG TACCAGAAGG ACGTAAAGCG ATAAATCCTT 


720 




CGTCAAATAA 


GACACGAATA 


ACATTTGATT TAGGAGAATT AATCTGCGAC GTTGTATCTT 


780 




TATCCAAATG 


ATAAACCTCG 


CTAGTTAAAT AATCTTCAAT TGCTTTCACT TTGAGTCCTT 


840 


25 


GAATCTCTTG 


CGGTGGATTT 


GAACGGAATT TGGTCATTAT TGCATTAATT TTCTTTTTCC 


900 




CTTCAAATCC 


TTCTAGCGTA 


TGCGgAATAA TGTATCCTCA TGTCTACCAA CAGTTTGATA 


960 




AATCTGTTCT 


AATTCATCTT 


TCAATGTTTT GCCATATAAT TTTAACTCAG AAGCGTATTT 


1020 


30 


TATAATGAGT 


GGCACAATTT 


GTACGGCATC TTTATCACGT ACAAAAGGCT CTGATAGAAA- 


1080 




ACCGTAACTC 


TCTTCAAATG 


CGAAAATCAT ATTTGATGAT CATCCAGTTG TCTTATTTCC 


1140 




TGAGCAATAA 


ATTTAAGCCC 


GTCAGCACCT CTTTGGTATT CAACATTATT ATA 


1193 



35 

(2) INFORMATION FOR SEQ ID NO: 253: 



tl) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1098 base pairs 

(B) TYPE: nucleic acid 
40 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

45 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 253: 

TATCAGGATG ATTATGnCGG GGTTTTATTA AGTCTGAGCG TATATnCCTT TTATTCTCCT 60 

AAATGGTTTG GAATTCAAGG AGAAGACGAT GAAATGGTAT CCAAAAACCA AnGAATATAT 120 

SO nGCATTAAGT CTGAGGATGA TAGTGCGGTG GCAATTCGTT CATTAATTTT GCATAAAGAT 180 

GAACCTATGT ATTTAAAAAA ACGTACATGT GTACCTACTT TGTTAATTAA TGGGGAACAT 240 
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AAAAAAATCT TCGAACATTC AGGACATGCA CCGCATATTG AAGAACCAGA AGCATTTATG 360 

AATTATTATT TAAAATTTTT AAAAAGCGTA TCATAATATG TGATATATAA ACCTAGGGCA 420 

TAAAGTCCTT AGGCAATGTG AAAAAGCTGA TTACTATTCA TTATTTGATA GAAATCAGCT 480 

TTTTTTGAAA TGTATTTGAT ATATACTGCT CGTTATGCGG CTATCTTCCT TATATTAAGT 54 0 

GCCATTAGTG CAAAACCTCT TAACAATTAG GTAAAAAGAG CATAAAAAAA GGAAGTTTAA 600 

TAGAATGTAT CATCTATCAA ACTTCACCAA ATTGCGCTAA ACAAAATTAT AGTTCAATTT 660 

CGTTGTTTGC TTCAGTGATT CGTTTATTTA CTCGACTCAA TAATGATTCG ATTTTTTTAC 720 

GTTGTTGTGC ATTAACAAGA ATTAATACAG TTCTTTCATC ATGCTCATTA CGTTTTTTAT 780 

CGAAGTAATC TTCTTGAGAT AAAATTTTAA CTGCTTTAAC AACTTGTGGT TGTTTGTAGT 840 

TTAAATGATT AATAATATCt TTAAGATAGT ATTCTTTCTC TTTGTTTTCG CTGATGTATG 900 

TCAATACAGC GAATTCTTCA AAGCTAATTG AnAATTCCTT TTTAATTAAA CTTTTTAATT 960 

TGTCAGCATA AGTGACCATT GATAACAACT CAAAGCAATC . ATTGATTTTT GTAATTGCCA 1020 

TGTTTAAAAC CTCCCTATTT GATGCATCTT GCTCGATACA TTTGCCCCGA TAATATAnTG 1080 

25 TATCTAATCT TTATGnAT 1098 
(2) INFORMATION FOR SEQ ID NO: 254: 



10 



15 



20 



30 



35 



40 



45 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2881 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 254: 

CCAGGTAAAA TTGTGCAATC ATTTGACGCA TTAATGGACG CCTTGGACAA TGAAGATTAT 60 

GAAGGAGAAA AAGTCATTCC ATTCTTAGAT AAACATTTTA AATATCAAGA TGGCCGATCA 120 

AGTGAGCGTT TAGTCAGAAA TTTATTTGGT AGCTAAGTTT ATATAGTAGT CAAAGTGGGA 180 

GAGGTATAAT GATGAAATTT TCAGTAATAG TTCCAACATr CAATTCAGAA AAGTATATAA 24 0 

CAGAATTACT TAATAGCCTT GCGAAACAAG ATTTTCCGAA AACTGAATTT GAAGTGGTTG 300 

TAGTTGATGA CTGTTCAACA GATCAAACGT TACAAATAGT TGAAAAGTAT CGCAATAAAT 360 

TGAACTTGAA AGTAAGTCAA CTCGAAACAA ATTCTGGTGG TCCAGGTAAA CCTAGAAATG 420 

50 kGGCGTTAAA ACAAGCAGAA GGTGAATTTG TATTATTTGT GGACTCCGAT GACTATATAA 480 

ACAAAGAGAC TTTAAAGGAT GCAGCAGCAT TTATTGATGA ACATCACTCA GATGTCTTAT 54 0 
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CACCTGAAGT TACTTTGTTA AATTCAAGAA TTATCTATAC TTTAAGCCCG ACTAAAATCT €60 

ATAGAACAGC ATTACTAAAA GATAATGACA TTTATTTTCC AGAAGAATTA AAGAGTGCAG 720 

5 AAGATCAATT ATTTACAATG AAAGCATATT TAAATGCAAA TCGAATCAGT GTGTTAAGTG 780 

ATAAAGCGTA TTATTATGCT ACAAAGCGTG AAGGTGAACA TATGAGTAGT GCGTATGTTT 840 

CACCTGAAGA CTTTTATGAA GTCATGAGAT TGATTGCTGT AGAAATATTA AATGCAGATT 900 

JO 

TAGAAGAAGC CCATAAAAAT CAAATCTTAG CAGAATTTTT AAATCGTCAT TTTAGTTTTT 960 

CTCGTACGAA TGGCTTCTCA CTTAAAGTTA AACTAGAAGA TCAACCACAA TGGATTAATG 1020 

CTCTAGGAGA CTTTATACAA GCAGTTCCAG AACGTGTAGA TGCATTGGTG ATGAGTAAAT 1080 

15 

TACGACCATT GTTGCACTAC GCGAGAGCGA AAGATATAGA CAACTATAGA ACTGTGGAAG 1140 

AAAGTTACCG TCAAGGTCAA TACTACCGTT TTGATATTGT AGATGGTAAA TTAAACATTC 1200 

AATTCAATGA AGGCGAACCA TACTTTAAAG GCATTGATAT CGCTAAGCCA AAAGTGAAAA 1260 

20 

TGACAGCATT TAAATTTGAT AATCATAAAA TTGTTACAGA GCTAACGTTA AATGAATTTA 1320 

TGATTGGCGA AGGACATTAT GATGTCAGAC TTAAATTACA TTCACGAAAC AAGAAGCACA 1380 

25 CAATGTATGT ACCTTTAAGT GTCAATGCGA ATAAACAATA TCGTTTTAAC ATTATGTTAG 144 0 

AAGATATTAA AGCGTATTTA CCTAAAGAAA AAATTTGGGA TGTTTTCTTA GAAGTCCAAA 1500 

TAGGTACGGA AGTATTTGAA GTGCGTGTTG GTAATCAACG TAATAAATAT GCATATACTG 1560 

30 CAGAAACAAG TGCATTAATT CATTTGAATA ATGATTTTTA TAGATTAACA CCGTATTTCA 1620 

CAAAAGACTT TAATAACATT TCGTTATACT TTACAGCTAT TACATTAACG GATTCAATCT 1680 

CATTGAAGTT AAAAGGTAAA AACAAAATCA TTTTAACTGG TCTGGATCGT GGTTATGTAT 174 0 

35 TTGAAGAAGG TATGG CTAGT GTCGTACTAA AAGACGACAT GGTGATGGGA ATGTTAAGCC 1800 

AAACfiTCAGA AAACGAAGTG CnAAATCTTA CTTAGCAAAG ATATTAAAAA GCGAGACTTC 1860 

AAAAATATTG TTAAGTTAAA CACTGCACAT ATCACTTATC CACTAAATAA ATAATAAATG 1920 

40 

CCCTCAAATC ATTGTGAGCC AACATGATTT GAGGGCTTTA TTTTGCTGTT TATGACATGA 1980 

TTATGACATT TCCCTGATTT TCATTTTCAT ATACATTAAA TTGTATACAC TGGAAATGAG 2040 

GAGGTTATCT ATAATGATAA ATAAAAATGA CATAGTAGCA GATGTAGTAA CTGATTATCC 2100 

45 

GAAAGCAGCG GATATTTTTA GAAGTGTGGG AATAGATTTT TGTTGTGGCG GACAAGTAAG 2160 

TATAGAAGCA GCAGCCTTAG AAAAGAAAAA TGTAGATTTG AACGAATTAT TACAGCGTCT 2220 

5Q CAACGACGTT GAACAAACGA ATACACCAGG TTCGTTAAAT CCTAAATTTT TAAATGTTTC 2280 

ATCACTTATT CAATATATTC AATCAGCATA TCATGAACCT CTAAGAGAAG AATTTAAAAA 2340 
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TGAGTTAAAA GAAACATACG ATACATTTAA AAATGGCATG TTAGAGCATA TGCAAAAAGA 24 60 

AGACGATGTC GATTTTCCAA AACTCATTAA ATATGAGCAA GGTGAGGTAG TAGACGATAT 252 0 

5 TAATACTGTG ATAGATGATT TAGTTTCAGA CCACATTGCA ACGGGAGAAT TGTTAGTAAA 2580 

AATGAGCGAA TTAACATCTA GTTATGAACC TCCGATAGAA GCGTGTGGTA CTTGGCGACT 264 0 

TGTTTATCAG AGATTAAAAG CACTTGAAGT GTTAACACAT GAACACGTAC ATTTAGAGAA 2700 

10 

TCACGTATTA TTTAAAAAAG TATCATAAAT AACGCGATTA GAAACTGTTG GCAAAAATAA 2760 

GTCCAGCAGT TTTTCGCTAT GTATAAAAGT CATAATAGTG ACATAAACAG CATTATTTGA 2820 

AAAGAAnAAT GGTCAACTTA GCATAAAAAT TGATATGAAn ATTTAATGGT ATAGATAATT 2880 

15 

A * 2881 

(2) INFORMATION FOR SEQ ID NO: 255: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1056 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear. 

25 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 255: 





ACCGTCGAAT 


ATCGCTTGTG 


ATTTACAATT 


TGTGTATTAA 


GATGCTCAAC 


TAATTTGGGT 


60 


30 


ACATATTCCG 


AATTTAGATT 


TGCAAGTACA 


ACAATTCCAT 


AATTTTGTTT 


TGGATTTAGT 


120 




AAAATAAATG 


ATGAAAAGTT 


ATCTAGCGTT 


CCTGAATGAA 


ACACTAAATG 


TTCATCATTA 


180 




TTGGTAAACC 


AGCCGGAAGC 


ATATGCATTG 


GCATTAGGTT 


CACCAATTGT 


TGAAGATAAA 


240 


35 


TTTTTATGTG 


ATTGTTGAAC 


TAATGATTTG 


TATTTATCAG 


GTGGATTAAG 


TTGGAATTTT 


300 




ATCGAATGTT 


CCAAATCTTC 


AGTTGATGTC 


ATCATATATG 


CTGATGGTGT 


ATCCCAAAGG 


360 


40 


TTAAATTCAG 


GTTTAGAGAC 


GACAGGTGTC 


GAACCTTGTA 


ATTCATAGCC 


AATAGCATCA 


420 


TGTTTTGATT 


TGTAATTGGT 


TTGTTTGAAT 


GATGTATGTG 


TCATATGCAA 


AGGCTTGAGC 


480 




CATGAATTTG 


TAATATATTT 


TGTATAGGAT 


TGCTTCGTAA 


CGTTTTGGAT 


AATTAAACCT 


540 


45 


AATAAATCAT 


AGTTCATATT 


TGAGTATTCA 


AATTCTTCTC 


CGGGCTTATG 


ATGTAATTCA 


600 


TCACCCATAA 


TTGCATGGGT 


TACATCATTT 


AAACGATTAT 


TTTTGCTTGT 


CACAGAATCT 


660 




tCGCTTGTAA 


TAtCACTAGG 


TATACCACTT 


GTTTGAGCCA 


AAAGTTGCTT 


AATCGTAATA 


720 


50 


GTTTCATTTT 


GACCATTATA 


GTTCATTTTA 


AAATGAGGCA 


CATGTTTGGA 


TACGGCATCA 


780 




TTTAAGTTTA 


ATCGACCTTC 


TTGAGCTAAT 


TTTAAAATTG 


CAAGACCTGT 


GAAAGCTTTC 


840 
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TGATAACCAT AACCTTTATT TAAAAAAACT TTGCCATTTT TTACTAyTAA AATTGATGCT 960 

CCAGGAATGT GTCCCTTTTG TAAATCATGC TCGATAATTG TATCTATTTG TTGTTGCGAA 1020 

5 TCATTGGTTA ACCGTGTCTT CGTATTGCTA TTTAAT 1056 

(2) INFORMATION FOR SEQ ID NO: 256: 

(i) SEQUENCE CHARACTERISTICS: 
w (A) LENGTH: 1277 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

15 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 256: 

ATGCCaCACT TATTGGTGGC AGGATCGACG GGTAGTGGTA AATCTGTTTG TATAAATGGT 60 

ATTATTACAA GTATTTTATT AAATGCTAAG CCGCATGAAG TTAAACTTAT GTTAATCGAT 120 

20 

CCGAAAATGG TTGAACTAAA TGTTTATAAC GGAATTCCAC ACTTATTAAT TCCGGTTGTT 180 

ACAAATCCTC ATAAAGCTGC TCAAGCTTTA GAAAAAATTG TAGCTGAGAT GGAAAGACGT 240 

2S TATGATTTAT TCCAACATTC ATCAACTAGA AACATTAAAG GTTATAACGA ATTAATCCGT 300 

AAGCAAAATC AAGAATTAGA TGAGAAGCAA CCAGAATTAC CTTATATCGT TGTTATTGTA 360 

GATGAGCTTG CAGATTTAAT GATGGTAGCT GGTAAAGAAG TTGAAAATGC GATTCAACGT 420 

30 ATTACACAAA TGGCACGTGC AGCAGGTATA CATTTAATTG TAGCGACACA AAGACCTTCT 4 80 

GTGGATGTAA TTACAGGTAT CATTAAAAAT AATATTCCAT CTAGAATAGC TTTTGCTGTG 540 

AGTTCTCAAA CAGATTCAAG AACTATTATT GGTACTGGCG GCGCAGAAAA GTkACTTGGT 6 00 

35 AAAGGTGACA TGTTATACGT TGGAAATGGT GACTCATCAC AAACACGTAT TCAAGGGGCG 660 

TTTTTAAGTG ACCAAGAGGT GCAAGATGTT GTAAATTATG TAGTAGAACA ACAACAGGCA 720 

AATTATGTAA AAGAAATGGA ACCAGATGCA CCAGTGGATA AATCGGAAAT GAAAAGTGAA 780 

40 

GATGCTTTAT ATGaTGAAGC GTATTTGTTT GTTGTTGaAC AACAAAAGGC aAGTACATCA 84 0 

TTGTTACAAC GCCAATTTaG AATTGGtTAT AATAGAGCAT CTAGGTTGAT GGATGATTTA 900 

GAACGCAATC AGGTAATCGG TCCACAAAAA GGAAGCAAGC CTAGACAAGT TTTAATAGAT 960 

45 

CTTAATAATG ACGAGGTGTA AAAAAATGTC AGAAATGAAT GCGGTATATA ACGTTAAACA 1020 

ATaCATTTtA AATTTgATTA AGCAAAATAA ATTGGAATAT GGTGACCAAC TTCCAAGTAA 1080 

so TTTATCAATT GCCAGAGAAT TAAATGTAAA AACCGACGAT GTTTATGAAG CAATTCAGcA 1140 

TTGATTACTG AACAAGTCAT TAAAGATAtT TTGAAGAGGG CACAAGTGTT AAGTCACTGC 1200 
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GrtTTGAATG CGGAACT 1277 
(2) INFORMATION FOR SEQ ID NO: 257: 

5 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3557 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
CD) TOPOLOGY: linear 

10 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 257: 



15 



20 



25 



35 



40 



45 



50 



TACCGTCGTT TTATGyGTCA 


AATTTTACAG 


TAAATTTTGC 


TTCATCAAAA 


GAAATAACCT 


60 


TTAACAAGTA 


TAGTAATTTT 


ACATTTTACA 


ATGTTACAAA 


ATATAATTTT 


TTATAATTAG 


120 


TTAAAATCAC 


TAAAACGCTT 


TTATACACTA 


TCAAATCAGC 


ATTTATAAAA 


ATATGAACCG 


180 


ATATCCTAAA 


ATGTTAATAA 


TATTACAAGA 


TAATAACArA 


CCACACAAAG 


CTACTTATTT 


240 


TTGATAATAT 


GGAAATCGTA 


ATATAAAACn 


AAAACTTAAT 


TTACTATATA 


AATTGTCTTA 


300 


ATAATTTTTA 


AAAGTAGTAA 


AACATAATTT 


TAAGGAGGAG 


TCCCTTTGAA AAAATTAGCA 


360 


TTTGCAATAA 


CAGCAACATC 


TGGTGCAGCT 


GCATTTTTAA 


CGCATCATGA 


TGCACAAGCT 


420 


TCTACACAAC 


ATACAGTACA 


ATCTGGTGAA 


TCATTATGGA 


GTATTGCTCA 


AAAATACAAC 


480 


ACTTCAGTAG 


AGAGTATTAA 


ACAAAATAAC 


CAATTAGATA 


ACAACTTGGT 


ATTCCCTGGT 


540 


CAAGTTATCT 


CAGTAGGTGG 


AAGTGATGCA 


CAAAATACGT 


CAAACACTTC 


TCCACAAGCT 


600 


GGTTCAGCAT 


CATCTCATAC 


TGTACAAGCT 


GGTGAATCAT 


TAAATATCAT 


TGCTAGCAGA 


660 


TATGGTGTTT 


CAGTTGATCA 


ATTAATGGCA 


GCCAATAACT 


TACGTGGTTA 


TTTAATTATG 


720 


CCTAACCAAA 


CATTACAAAT 


TCCTAATGGT 


GGATCAGGTG 


GTACAACACC 


AACAGCTACA 


780 


ACACS5TAGCA ATGGCAATGC 


ATCATCTTTT 


AATCACCAAA 


ATTTATACAC 


TGCTGGTCAA 


840 


TGTACATGGT 


ACGTATTTGA 


CCGTCGTGCT 


CAAGCTGGTA 


GTCCAATTAG 


CACATATTGG 


900 


TCAGACGCTA 


AGTATTGGGC 


TGGTAACGCA 


GCTAATGATG 


GTTACCAAGT 


AAACAACACA 


960 


CCATCAGTTG 


GTTCAATTAT 


GCAAAGCACA 


CCTGGTCCAT 


ATGGTCATGT 


TGCTTATGTT 


1020 


GAACGTGTCA 


ATGGTGATGG 


TAGTATCTTG 


ATTTCTGAAA 


TGAATTACAC 


ATATGGTCCA 


1080 


TACAATATGA 


ACTACCGTAC 


AATTCCAGCT 


TCAGAAGTTT 


CTAGCTATGC 


ATTCATCCAT 


1140 


TAATTAAATA 


AATTGTACTG 


ATATATACTA 


GCAATTCACA 


TCATGTGAGA 


TTGCTAGTTT 


1200 


TTTATTTTTG 


AAAAAAATTT 


TCATTTTGGT 


ACAAAAAATT 


ATCTCACCCT 


TCCCTATCAT 


1260 


ACATATTTAT 


ATTTTGTATG 


AATGGTAGTT 


AGGTAAAAAT 


TAACAACCTA 


CCTATTTGAT 


1320 
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ATTTAATTTG TTATACCAGT ATTTTACGCT TTTTCGTCTA CATATACAAA TTTATATTAA 1440 

ATAAAGCCCA ATACAATTTA GGTTAATTAA ACAAGTTGAT AACTATTTAA TTATTCCTTC 1500 

5 ATTGAAGAAT ATAAACTATT AAATCATTAT TTTGCTCTTA CATATATTTT AATGACCTAA 1560 

CTGaTTATGT TCCATGGAAT ACATTTATAA TATAGCCTCC TAATTAArAT GCyTTGTCTT 1620 

GGTCATTCTA CGTAAATTCT ATAAAATATG TTATCTACTT ACATAArArn CTGrACTTCA 1680 

10 

ATACCACCAT ATGTTTGTGA TACTGAAGTT CAGTTTAGTT TTATTTTCAA TTAGAAAAAT 1740 

AAGTTAAGTA TATAGAATAG TAAACCTGCT AACAATGCTG AAATAGGTAA TGTAATCACC 1800 

CATGTAATGA TCATTCGTTG CGCAgTGCTC CATTTTACAC CTTTAGCTCG GTTAGAAGCA 1860 

15 

CCAACACCTA AGATTGATGA TGACACAACG TGAGTTGTTG ATAATGGGAA ATGTAGCGAT 1920 

GATGCAACAA AAATTGTTAA TGCAGATGAT AAATCGGCCG CAGCACCATT TGCTGGACGT 1980 

ATTTTCATAA TATTACCACC TACAGTTTTG ATAATTTTCC AGCCACCAAT TGCAGTACCA 204 0 

20 

AGCCCCATTG CTGTCGCACA GGCAAATTTT ACCCATAACT GTGGTTCAAC ACTGCCATCA 2100 

TTCTGTACAT TAGCGACAAT CAATGCCAAC GTAATAATAC CCATTGATTT TTGCGCATCA 2160 

25 TTCGTACCGT GAGAGAATGA TTGTAACGCT GCTGTGAAAA TTTGGAAAAA TCTAAAGTTA 2220 

CGATTCGCTC TTGTTAAATT TGCATTTTTA AAGATAACTT TAAAAATTGA ATACATCAAG 2280 

AAACCAACAC AAAATGCGAT AATCGGTGAA ACGATTAATA CAATAATAAT TTTTGTGAAA 2340 

30 CCTTGGTAAT GTAACACTCC AAATGAGCCT TCAGATGCGA TTGCTGCACC CGCAATTGAA 24 00 

CCTATAAGTG CATGTGAAGA CGAACTTGGA ATTCCGTAAA ACCAAGTAGC TAAATTCCAA 24 60 

ATAATAGCCG CAAGTATTGC AGCTAACACA ACAACTAATC CATTTTCCAA TTTAAATGGA 2520 

35 TCGACAATGT CTTTAGTAAT GGTGCCTGCA ACGCCCGTAA ATGTTAAAGC ACCTATAAAG 2580 

TTCATCACTG CTGCCATTAA AATTGCCGTT TTAGGgTTAA CGCTCTAGTA GATACAGCAG 264 0 

TAGCTACTGC ATTGGcTGTA TCATGGAaTC CcATTGATAA AGTCAAATAT CAGCGAGAAA 2700 

40 

ATAACTACAG CTATAGTGAC GATGATTATA TATGACATAA ATATATACTC CCCTTAGCTA 2760 

TTTTTCATAA TAATAGTTTC AAAATTATTT GCTACGATTT GACATTTATC AGCGATTTCT 2820 

TCCATGCTTT CATAAATATC TTTTATTTTA ATTAAAGTGA TTGGATCTGT TTCGCTATTG 2880 

45 

AAAATATGTT TAATTGACTG TCTTAAAATA CCATCACAGT TTGTTTCAAA TTCTTTAATA 294 0 

TTAATTGAAT GAATACGCAT ATGTGATAAT TTTTTATCGA CTAATAAGCC GACAGCAAGT 3 000 

5Q TTCATTTCTG CAACTGCTTT TTGAATGTTA TCAACAAACT CAGCCATATA TTCATCTGTG 3060 

TATTCGATTG AATACATTTC AAACATrGCT GCCGTTTCTT CAATTGCATC TAAAACATCA 3120 
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TTTAAATCAG TAATTACTTG ATGTACTAAt tCGcACCATG TGACTCATAA GTTTTAATGT 3240 

TGTCTGAGTA TGCTTTTAAA TCTAAATGTG TATTGAAATC CATTTTACCG AATTCAATAG 3300 

5 CAGCACGATC CAGATTGAAA ACCATCTCTT CTAATTGAAC CATAAACTTA TCTTTTTTCT 3360 

TACTAAACAT TTAAAATCCT CCATTTAAGC GATTGTCACC AATCACATTC AGTTATAATT 3420 

TGTTTCAAAT TAAGACAAGT GAATTTACAA ACTAATGATA CAAATTTGTT ATTATCAATC 34 80 

10 GTCAGTATAA TTTTAGTGTA CTGATATTAA TTTCAAAAAT GCCTCACAGT AAACAATTTA 3540 

CTGTATTTGC CCTTATA 3557 



(2) INFORMATION FOR SEQ ID NO: 258: 

15 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1631 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

20 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 258: 

25 AACTATACAT TTCGAAAAAT TCTTCTAGTG AACCTGCGCC ACCAGGAGCC ATGACAAATG 60 
CATCTGCAAG TTCTGCCATT TTATTTTnAC GTTCATGCAT AGAATCAACT AAAATTAATT 120 
CAGTTAAACG TTGGCTTGTG ATTTCATGTT CATCTAACAT TTTAGGCATG ACGCCAATAG 180 

30 CTTTGCCGCC ATGATCTAAT ACACCATCTT GaATGGCACC CATAATGCCA ATTGACCCTG 240 
CACCAAATAC TAATTCATAA CCTTGTTCAG CAAAATATTT ACCTAAATCG TATGCTTTTT 300 
GTACATATGA AGGGTCATGA CCTTTGCTTG CACCACAATA AACTGCGATT CGTTTCATGT 360 

35 TAATCCAGCT CCTTAATTCG ATGAATGACT TTTAATAGTG ATTGTTCAAA CACTTTTTGA 420 
TCTTGCTTTG TAAAAGGTGG GGGACCTTTG TGGCGACCAC CTTGTTTTCT AATTTGTGCA 480 
TTCATATATC GTTTATCTAA TAGTTGTTGA ATATTTTTGG AATTGTATAT CTTCCCATTA 540 

40 

TGATGCATGA CAATTAAGAC TTTGTCGACT AATAAACTTG CGAGTCCATA ATCTTGAGTG 600 
ACTACGATAT CATCCTTCGT TGATAATTGA ACAATTTTGT AATCAACTGC ATCTGGTCCA 660 
TCATCAACAT ATAATGTTGA TACATGTGGA GGATATAATT GGTTCGAAAA ATGGCTGAAG 720 

45 

CTCCGAATAA TTGTCACAAA AATGCCTGTC TCAGTTGTTA AATCTATAAT AGAATCAACA 780 
ACAGGACAAG CATCTCCATC AATAATAATA TGTGTCACAA TTATGCCTCT GTATTGTTTT 840 
CTTTATTTTG TTGAGAGGCG CTTTTGGCAA CATAATCTTT ATATTTTTTA AATGACTTGA 900 

50 

TGCGTGCTTT ATCAGCTTCT TGTTGGCGTT TTTGTTCTTC TTTGTGTCGT TTTTCAATAT 960 

55 



1053 



EP0 786 519 A2 



5 



10 



15 



CGCCTTTTTT 


CTCAGTTTTC 


TCATCTAATT 


TATTAGGTGT 


TAAGCCTGCT 


TTTTCTTCGT 


1080 


ATTTTTGTGA 


TTTTTTCATA 


TCTTTAATAC 


GTTGTATTTC 


ATTCTTTTCG 


CGGGCTTTTT 


1140 


GCTCTTCTTT 


ATGACGCTTT 


TCGATATTTT 


TTTGAAGTAT 


TTTATTCATT 


TTATCAGCGT 


1200 


CTTTACGATT 


TTGTTTAGCT 


AATTTTTCGC 


CTTTTTTCTC 


AATATAGGCA 


GGATCATGTT 


1260 


CTCTAGCAAA 


CTTTTTAAGT 


TCACGTTTAT 


TTTCAAAATC 


TTGTTTTTTA 


TCGCCGACAT 


1320 


ATTCTTTAAC 


ATCACTCGCT 


GTGTTACTGA 


TTGCTGCAGA 


TGTTTTTGAA 


GCAACTTTAC 


1380 


TTGTAGCATC 


TGTAACTTTT 


TGTACGTCCG 


GATGTTGTTT 


GATACGTTTA 


CGTTCAACAA 


1440 


TTAACGGTAC 


CAATACAATT 


GGTAATACAT 


TAATCATAAA 


TTTGATGACT 


TTTTTCTTAT 


1500 


CCATAGATCT 


TGcCTCCaTA 


ATTACTTTAT 


TAAtTTTACa 


TACCCtATGa 


TACATCAATA 


1560 


TAAACGATGA 


TAGTAGTGAA 


TCACTATTAA 


GTATTTCAGA TGTTTtTTAA AAgaAGaCCC 


1620 


AATTAnAAAA 


A 










1631 



(2) INFORMATION FOR SEQ ID NO: 2 59: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6645 base pairs 
25 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 259: 



35 



40 



45 



50 



CGAAATCATG 


ATTTAATGCT 


TTTTCATATA 


AGCTTTTCCA 


ATTAATCTTT 


CGTCCATGAT 


60 


ATTCTTCAAC 


TGTTGCTAGA 


TATTGTGCAA 


TTTTAGTTAC 


TTTAAAGGAG 


TGTGCTGCAA 


120 


CaTTGTGkTC 


mAAATATTTA 


AATTTTCCaG 


GtAATCTTAT 


AAGTCTTTCC 


aTATCTGATA 


180 


ATCTtTTAAA 


ATATTGATGT 


ACACCCATTT 


CAATTACCTC 


CTCCATTAAT 


TAATCATAAA 


240 


TTATACTTTC 


TTTTTACATA 


TCAATCAATT 


AAATATCATT 


TaAATATCTT 


CTTTaTATAA 


300 


CTCTGATTAA 


ATGATACCAA 


AAAATCCtCT 


CAACCTGTTA 


CTTAAACAGG 


CTAAGAGGAT 


360 


AGTCTTGTCT 


TGATATATTA 


CTTAGTGGAT 


GTAATTATAT 


TTTCCTGGAT 


TTAAAATTGT 


420 


TCTTGAAGAT 


TTAACATTAA 


ATCCAGCATA 


GTTCATTTCA 


GAAACAGTAA 


TTGTTCCATT 


480 


AGGGTTTACA 


GATTCAACAA 


CACCAACATG 


TCCATATGGA 


CCAGCAGCTG 


TTTGGAAAAT 


540 


AGCGCCAACT 


TCTGGTGTTT 


TATCTACTTT 


AAATCCTGCA 


ACTTTTGCTG 


CGTAATTCCA 


600 


GTTATTTGCA 


TTGCCCCATA 


AACTTCCTAT 


ACTTCTACCT 


AATTGTGCAC 


GACGATCGAA 


660 


AGCATAATAT 


GTGCAGTTTC 


CATAAGCATA 


TAAGTTTCCT 


CTGTTAGCAA 


CTGATTTATT 


720 
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TACATTAACT GTCTTAGTTA CTGCTTGCTT 
TGCTTGTTGT ACAGGTTGTT TTACTACCTT 
5 TTTAACCGCT TTAGTTTGTT TCACTTTATT 

AAAAATTAAA GGTGTTACAC CAGGATTGTA 
CTCTAAAGCA ATCTTATATA ATGAATCGCC 

10 

CGTTTGTGCT TGAACATTTG ATACATAATT 
ATGTTGTTGT GCATGTGCTG CATTATTTAA 
CACTGTAAGA GATTTTTTCA TCTTGCTGTC 

15 

AAATACTATA GCACAATACA TTTTGTCAAA 
TTAACAATAT AAAAAGAATA CAACCTTTTA 
ATTGAGAACG TTTTCAATAA TTAATTCAAT 

20 

AAATGCACAC TGCATATGTT GTTTTAACAA 
TATCTACCGA ATTGTACTTA AATATTCATA 

25 ATTTATTTAG CTACCTTTAA AAAAACCAAA 

AAATATATAT TAATCGTGCG ACATTGTCTG 
GTCTCCATCC ATCACTGCAT CAACCTTACC 

30 CATTGAGTAT GGATGGAAAA CATATGATCT 

TTCGCCACGA ATTTCAGCCA TTTCACGTGC 
AGACTTTAAC ATTTTCATAG CTGCTTCACG 

35 ATTAACAACT ATACCTGAGG GGTGGTGGGT 

ATGCTGACCA CCTGCACCAG AAGCTCTGAA 
TTCAATCTCT ATTTCATCAT TATTAAAATC 

40 

ATGACGACGT CCTGATGAAT CAAATGGAGA 
AGCTTTTAAA TAACGATAAG CATTATGCCC 
CGCTTCATCC CCAGGTAGAT AATCAACAGT 

45 

ACGTTGATAC ATTCTAAATA GCATATTAGC 
AGGATGTAAC TCTAGAATTG CGTTATTGGC 
so TTCGTATTCA TCCACTTTAG CCTTAAAATT 

TTCTTCATCA AATTCTTCTT GTAATAAATC 



AGGTGCTTGC TTAACTACTA CTTTTTTAGA 840 

TTTAGCTTGG CTTGCTTTTC TTACTGGTGA 900 

TTGAGGCACA AGTGAAATCA CGTCACCAGG 960 

TGAATATAAT TGATTCAACG TTAAGTGATG 1020 

AGCAACTACT GTATAAGTTG TCGGTGATTG 1080 

ATGTTGAACA GGTGTTTTTA CTTGTGTGCC 114 0 

AGCTAAAAAA GCTAACACTG ACGAAACCGT 1200 

ATTCCTTTGC TGTTAGTATT TTAAGTATGC , 1260 

AGCTATTGTT ATAACGATGT AATCAAATGG 1320 

TCATAGTGTA AAATGTATTC ATACCATGTA 1380 

ACCTTGAAAA TCGCCATAGG TAATATTACT 144 0 

ACACAACTTT TAAAAAATAT ATTCTAACTC 1500 

AACAAATCAT ATTCCAAAAT CTAATTTACA 1560 

AACCGACGCC CTTTTAGAGC CTCGGTTTTA 1620 

TCTTAAATAT GATTCGATAA ATGGTCCAAT 1680 

TGTTTCTTCG TTCGTACGAT GATCTTTCAC 1740 

AATTTGGCTT CCCCAGCCGA TTTCTTTTTG 1800 

CTGCTCTTCC AATTTTAATT GATATAATTT 1860 

GTTTTTAATT TGAGAACGTT CATTTTGGTT 1920 

AATTCGTATT GCCGATTCAG TTTTGTTAAT 1980 

TGTATCAACT GTAATATCAT CCGGATTGAT 2040 

TGGAATAACG TCGCATGATG CAAATGATGT 2100 

AATTCGTACT AGTCGGTGTA CACCTTTTTC 2160 

TTTGATGAGC AATGTTACAC TTTTAATCCC 2220 

TTCAACTTTA AAGCCTTTCT TCTCACAATA 2280 

CCAATCTTGA GACTCCGTGC CACCTGCACC 2340 

ATCGTGAGGC CCATCTAATA ATAATTGCAA 2400 

AATGACCTCT TGCTCTAAGT CTTCTTTCAT 2460 

CCAAGTAGCA TCCATGTCAT CTACTTCTGC 2520 
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TTGCGCTTTC GTTTGGTTAT CCCAAAAATT 
AATATTAGTT TCTTTGTTCT CTAAGTCAAA 

5 

TATACTTATC TATATTTCGT TTGATTTCTG 
TTTCAATTCA AGTCATTGAT TTGCATCTTT 
AAATAACAAT GTTAAGAAAT ATAAGCACAC 

10 

AATCAGTACA TTTATCATCG ACATATGCCT 
AACGTTTAAC AACTTCTTCA CATTTTTTAA 
CCTCCCATAA CACAAACTAT AGGTGTTTAA 

15 

TCCATGGCAA TTTTTGAATT TTTTACCACT 
TTGATCGCCT TTAACGATTG GTTTCGGTTT 

2Q GTGcTTCGCT TCACCAAACT CTGTTGTTTT 
TACAGATTTT AAAATGAATT TACAAGTATC 
TAATTCATGA CCTTCATTTT GATAGTCACG 

25 GTGAATACCT TGACGTAATT GATCCATTGT 

AGAACGAaGT AAAATCATAC GCTCAAACTC 
ACTTTGATAT GCTGCTTCAA TCTTAGCCCA 

30 ACCTTTGATA TCATCCTCTG TAATGTCACC 

GATGAATGGT TGATATTCAG GCTCGTCATC 
TTGTAACGTT GAACGTAGCA TTGCATCTAC 

35 ACTATTTCTT TCGTTATAGA TAATTTCACG 

GATACGTTTA CGCGCGTCGA AGTTATTACC 
TCTTGATACC ATTTTTGATT CAATTGGTGT 

40 

TTTCTGTAAA CGTTCAGAAC CAAAACGAAT 
GCGACTATCC CCTTTATCAC CTTGACGTCC 
ACGAGATTCA TGTCGCTCTG TACCTATTAC 

45 

ACCTAATTTG ATATCTGTAC CACGACCAGC 
TTGTCCAGCG CCTGCAACAA TTTCAGCTTC 
50 ATGACGGATA CCACGTTTTT TAAGTAAATT 

AGTACCTAAT AGCACTGGTT GCCCTGCCTT 



AGGTTCTGCC 


ATCATTTCTT 


CATATTCTTG 


2640 


GAGACCCCCT 


AATTTGTGTT 


AAATCTTGAT 


2700 


ATAATTCCAT 


AGcATTCGCT 


CCTATTTATA 


2760 


TATAATGCTA 


AATTTTAACA 


TAATTTTGTT 


2820 


TGACAATTAG 


TTTATGCATT 


TATTGTTAAA 


2880 


AAACCGATTT 


TTTAAAACTA 


AGTACATAAC 


2940 


AGTATTTAAC 


GCTTGTAAAA 


TAAAAAGACT 


3000 


TTGGAAGGAG 


TTATTTTATA 


TCATTTATTT 


3060 


ACCACATGGA 


CAATCATCGT 


TACGACCAAC 


3120 


CACTTTTTCT 


TTACCATCTT 


CAGCTGAAAC 


3180 


TTCACGTTCA 


ATATTATCTT 


CAACTTGTAC 


3240 


TTCTTCAATA 


TTTTGCATCA 


TGATATCAAA 


3300 


TAATGGATTT 


TGTTGTGCAT 


AAGAACGTAA 


3360 


GTCGATATGA 


TCAGTCCAAT 


GGCTATCAAT 


3420 


ATTCATTTGT 


TCTTCTAAGA 


TA7CTTTTTG 


3480 


AACGACTTCG 


AAAATATCTT 


CAGCATCTTT 


3540 


TTCTTGTAAG 


AAGATGTCAT 


TAATGTAGTC 


3600 


TGCTGTATTA 


ATATAGTAAT 


TGATACTACG 


3660 


AACTTGAGAG 


CTGTCTTCTT 


CATCAATAAT 


3720 


TTGTTTACGT 


AATACTTCAT 


CGTATTCTAA 


. 3780 


TTCTACACGT 


TTTTGTGCTG 


ATTCTACAGC 


3840 


AGAGTCATCT 


AAACCTAGTC 


GGCTCATCAT 


3900 


CATTAATTCA 


TCTTGTAATG 


ATAAATAGAA 


3960 


AGAACGACCA 


CGTAACTGGT 


CATCAATACG 


4020 


TGCTAAACCG 


CCTAATTCCT 


CTACGCCTTC 


4080 


CATGTTAGTG 


GCAATAGTAA 


CGGCACCTTT . 


4140 


ACGTTCATGA 


TTTTTCGCAT 


TTAACACATC 


4200 


TGAAATATAT 


TCAGAAGTCT 


CAACTGCAAC 


4260 


GTGTTTTTCA 


ACAACATCTT 


CTACTACTGC 


4320 
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TTTATTTGTC GGAATTTGAG TTACTGTCAT GTTATAAATA TTTCTAAATT CTTCTTCTTC 4440 

AGTTTTAGCT GTACCTGTCA TACCCGCAAG TTTATTGTAC ATTCTGAAAT AGTTTTGGAA 4500 

5 TGTAATAGAC GCCATAGTTT TAGATTCATT TTGAATTTGA ACGCCTTCCT TCGCTTCAAT 4560 

AGCTTGGTGT AAACCTTCCG AGAAACGACG GCCTGGCATT GTACGTCCTG TAAATTGATC 4620 

GACAATTAAT ACTTCGCCAT CAACAACCAT ATAGTCTACG TCACGTTGTA ATGTAACGTG 4 680 

10 

CGCACGTAAA GCTGTGTTGA TATGACTAAT AACATCAACA TTTTGTACAT CATATAAGTT 474 0 

TTCAACTTTG AACATACGTT CAGCTTTATC CGCACCTTGT TCTGTTAAAT GTACAGCTTT 4 BOO 

CGTTTTTTCA TCGTATTTAT AATCTTCGTC CTGTTTTAAC ATTTTCGCAA AAACATTTGC 4860 

15 

TTGTGTATAA AGTGACGTTG ACTTTTCAGC TTCACCAGAA ATAATTAATG GCGTACGTGC 4920 

CTCGTCGATT AAAATTGAGT CAACCTCATC AATGATTGCA AAATGTAATG GACGCATTAC 4 980 

TCTATCTTCA GAATAATTCA CCATGTTATC TCGTAAGTAA TCAAAACCTA GCTCATTATT 504 0 

20 

, AGTACTGTAA GTAATGTCTT GTGCGTATGC TTCACGTTTT TCTTCTGTCG TCTTACTGTT 5100 

TAAGTTTAAT CCGACAGTCA AACCTAAGAA GTTATATAAC TCAGCCATTT CTTCACTTTG 5160 

2S AACACTTGAT AAGTATTCAT TGACTGTAAT AACGTGAACA CCTCTACCAG CTAATGCATT 5220 

TAAGTATGTT GGCATTGTCG CTGTTAATGT TTTACCTTCA CCTGTTCTCA TCTCAGCGAT 5280 

ATCACCTTTA TGAATTGCAA TACCACCCAT AATTTGAACT TTATATGGTG TCATATTGAA 5340 

30 TACACGTTTA GAGCCTTCTC TAACAAGTGC ATATGCTTCT GGTAAAATTT TATCTAAATA 5400 

ATCATTTTGC TTTTTGACAT TATCAATGTC AGCTAATTCT GTTTGGAATT GTTTCGTTTT 5460 

ATTACGAATT TCTTCATCAG TTAAAATTGC CGTTTTTTCT TCTAAAGCGA TTACTTTATC 5520 

35 AGCAAGTTTA CCTAACTGTT TAATTTCTTT ATTATTGCCA TCAAGAATTT TTGATAAAAA 5580 

TCCC&TTTCG TTCGCTCCTT TAGCTAAAAA ACTGTTTGGC CTACAACAAT ATATCTTATC 5640 

ATTTATAGTT AGAAAATTAT ACTTATTTAC TCATTTGTAG AATCAATATA AATATATTTA 57 00 

40 TGACATACTT CATTCACATT CTGTTGTCAA CAAGTTTATC ACTAATAAAT ATATTCTCAA 5760 

TACGCAATTA TACTTCCTAA TAAATTATAT TATAAATATT TTACGATTTT CGACTCGGAC 5820 

TATACAATAG ACTGACATAC TATTATTAAC TTAACATTCA AATATATACA TCCATTAACA 5880 

45 

TTAGCATAGT CACTATGTTT CATTCAACAA ATTACATTAT CGAACTATGA AATAGTCATA 5940 

ATTTGCTTTT GGAGTATAAA AAAGCACTTG TGCAAAAACA CAAGTGCTTT AAACTTAATT 6000 

TATTGTTCAC TAGTTTGAAT CAAGCCATAT TTACCGTCTT TACGGCGGTA AACGATACTT 6060 

50 

GTTCCATCAG TTTCTCTGTC TGTGAATACA AAGAAGTCAT GACCTAATAG ATTCATTTGT 6120 
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ATCTCGTTAT CATCGTAAGC GTCATTATCA ACTTGTGTTT CTTGCATTTC TTGTAATTCG 6240 

GCAACAAACA CTTCTTGATC TCCTCGATCA CGGCTCTTAC GATTAATACG TGTTTTATAT 6300 

5 TTTCGAACTT GTCTTTCAAG TTTATTATTA ATTAAATcAA TACCTGCGTA TAAATCATCG 6360 

TTTCGCTCTT CAGCTCTTAA CGTAACATTT TTCAATGGAA TTGTTACTTC AATTTTAGTA 6420 

GCTGAATTTG AATAAGTTTT AACTTTAACA TGCGCCACTG CATTTGGTAC GTCATTAAAA 6480 

10 

TAACGTTCCA ACTTACCAAT TTTTTCCkCA ATATAGTTGC GAATAGCATC TGTGATAGTG 6540 

AGGTTATCTC CATGAATTTC AAATCTAATC ATAGTAAATC TCTCCTTAAA CCTCTTTATn 6600 

GGnAACTCnT TATTATATTT AACATTTTTA CGCCAATCGT GCAAA 6645 

15 

(2) INFORMATION FOR SEQ ID NO: 260: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7430 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 260: 



35 



* 40 



50 



CAGTTCCAGC 


ACAtCTATTG 


GGGATCAACA 


AACTAGGGAA 


AATGCTAATT 


ATCAACGTGA 


60 


AAACGGTGTT 


GACGAACAGC 


AACATACTGA 


AAATTTAACT 


AAGAACTTGC 


ATAATGATAA 


120 


AACAATATCA 


GAAGAAAATC 


ATCGTAAAAC 


AGATGATTTG 


AATAAAGATC 


AACTAAAGGA 


180 


TGATAAAAAA 


TCATCGCTTA 


ATAATAAAAA 


TATTCAACGT 


GATACAACAA 


AAAATAACAA 


240 


TGCTAATCCT 


AGCGATGTAA 


ATCAAGGGTT 


AGAACAGGCT 


ATTAATGATG 


GTAAACAAAG 


300 


TAAAGTGGCG 


TCACAGCAAC 


AGTCAAAAGA 


GGCAGATAAT 


AGTCAAGATT 


CAAACGCTAA 


360 


TAACfiATCTA 


CCTTCACAAA 


GTCGAATAAA 


GGAAGCACCA 


TCATTAAATA 


AGTTAGATCA 


420 


AACAAGTCAA 


CGAGAAATTG 


TTAATGAGAC 


AGAAATAGAG 


AAAGTACAAC 


CACAACAAAA 


480 


TAATCAAGCG 


AATGATAAAA 


TTACTAACTA 


CAATTTTAAC 


AATGAACAAG 


AAGTGAAaCC 


540 


TCAAAAAGAC 


GAAAAAACAC 


TATCAGTTTC 


AGATTTAAAA 


AACAATCAAA 


AATCACCAGT 


600 


AGAACCAACA 


AAGGACAATG 


ACAAGAAAAA 


TGGATTAAAT 


TTATTAAAAA 


GTAGTGCAGT 


660 


AGCAACGTTA 


CCAAACAAAG 


GGACAAAGGA 


ACTTACTGCA 


AAAGCGAAAG 


ATGATCAAAC 


720 


GAATAAAGTT 


GCCAAACAAG 


GGCAGTATAA 


AAATCAGGAT 


CCTATCGTTT 


TAGTGCATGG 


780 


TTTCAATGGG 


TTTACAGATG 


ATATTAATCC 


TTCAGTGTTA 


GCTCATTATT 


GGGGCGGTAA 


840 


TAAAATGAAC 


ATTCGCCAAG 


ATTTAGAAGA 


AAATGGTTAC 


AAAGCTTATG 


AAGCAAGTAT 


900 
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TCGTGTAGAT TATGGTGCAG CACATGCAGC AAAATATGGA CATGAACGTT ATGGAAAAAC 1020 

ATACGAaGGA ATTTACAAAG ACTGGAAACC AGGACAGAAG GTACACCTAG TTGGACATAG 1080 

5 TATGGGCGGT CAAACGATAC GTCAACTAGA AGAATTACTG CGTAATGGTA ATCGTGAAGA 1140 

AATAGAGTAT CAAAAGAAAC ATGGTGGcGA AATTTCTCCA CTATTCAAAG GTAATCATGA 1200 

CAATATGATT TCATCAATTA CTACTTTAGG AACACCACAT AATGGTACAC ACGCATCAGA 1260 

10 TTTAGCTGGT AATGAAGCTT TAGTGAGACA AATCGTATTT GATATCGGTA AAATGTTTGG 1320 

TAATAAAAAT TCAAGAGTAG ACTTCGGGTT GGCTCAATGG GGTCTAAAAC AGAAGCCAAA 13 BO 

TGAATCATAT ATTGATTATG TCAAACGCGT TAAACAATCT AATTTATGGA AATCAAAAGA 1440 

15 

TAATGGATTT TACGATCTGA CGCGTGAGGG TGCAnCAGAT TTAAATCGTA AAACGTCGTT 1500 

GAACCCTAAC ATTGTGTATA AAACATACAC TGGTGAAGCA ACGCACAAAG CATTAAATAG 1560 

CGATAGACAA AAAGCAGACT TAAATATGTT TTTCCCATTT GTGATTACTG GTAACTTAAT 1620 

20 

CGGTAAAGCT ACTGAAAAAG AATGGCGAGA AAACGATGGT TTAGTATCCG TTATTTCTTC 1680 

TCAACATCCA TTTAATCAAG CTTATACAAA AGCGACAGAT AAAATTCAAA AAGGCATTTG 174 0 

25 GCAAGTGACG CCTACAAAAC ATGATTGGGA TCATGTTGAC TTTGTAGGAC AAGACAGTTC 1800 

TGATACAGTG CGCACAAGAG AAGAATTACA AGATTTTTGG CATCATTTAG CAGACGATTT 1860 

AGTGAAAACT GAAAAGCTGA CTGATACTAA GCAAGCATAA TTTATAAAGT AAAGGGAGGA 1920 

30 ATTAATAATG ACTGCAGACT TCTTTCAATT AATCGGATCA TTATTTAGAA TTCTAAAAGA ' 1980 

ATTATTCAAG TAAAACATTG GCGAGGCCCC AACATAAAGA ATTTCGAAAA GAAATTCTAC 2040 

AAACAATGCA AGTTGGCGGG GCCCCAACAA AGAAGCTGGC GGAAAGTCAG CTTACAATAA 2100 

35 TGTGCAAGTT GGCGGGGCCC CAACATAGAA GCTGGCGGAA AGTCAGGTTA CAATAATGTG 216 0 

CAAGTTGGGG TGGGACGACG AAATAAATTT TGCGAAAATA TCATTTCTGT CCCACTCCCA 2220 

TTGGCATTTA CGAAGTTTAA ATGTGCAATT AGAATATATG TATAACAATA TTAAACACGC 2280 

40 

GGTAAAACGA AGTCAGTCAA TTCAAACTGA TTTCGCCCAC CGCGTGTTTT TAACATAGCT 2340 

TAATAATTAA TAAGCATTAA TGTTCAATTT ATATGGTTGT TTTCCAATAA TAAACCTAAA 2400 

GATATAGAAT TCACGCAATA TCATGCCGAC ACCTATACAT AATCCTAAAA TGAATAGTAG 2460 

45 

TGATATCGCT AGAAAGACCA TTGTATTATC CTCAAATATA TTTGTATATG CAAACAATGA 2520 

GTCTAGAATG ATTGGATGTA ATAAATAAAT AAAGAATGAG AAAGCACTAA TCATTTGAAT 2580 

CGTATTAAAT AACATTGTTT TAAAATGCGT GCAAATACCC AAGATAACAA TAAACATAAT 264 0 

50 

ACTATTATAT GGTGTTAATG AATATGAAAA GCTGGTAACG TTCCAATAGT CTCCaTTTGT 2700 
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10 



15 



20 



25 



TCTAAGAAAT TTAATACACG TTCGTAGTTA TAACCCATAT ATGCACCTAA GAAGAAATAA 2820 

AAAATCCATC CGAATATTAT AGTATTTTCA CTTAATGGAT AATAGTGTAG CACGGTATCG 2880 

TGAAACGCTG TGTTGTTCGT AAAGTAATAT AAAAATGATT GCTGTAAAAT AAAAGATAAC 2940 

AATAATAATA TTTTACTGTT GAATAGGTTA TAGTTAATTT TAAAAATGAT ATAACTCAAA 3000 

ATAAAGAATT GCATGATAAC AACGATAAAA TAGCCATACC ATTGACCTAA TAGGACATTT 3060 

TCAATGAATT GTTTATTGAA ACTTGAATCT GTTAATAATG ATTCACTATA ACTGTAAAAC 3120 

AATCCCATTA ATATGTAAGG AATAAGTATA TATTTTACGC GTGTAGTTAA GTATCTATAG 3180 

GTGA C TTTTT GGTAATTCAA GGTTGTCAGT AACTGTGACA AGATAATAAA GCAAGGTGTA 3240 

CCAAAAATCA CAATATTACG AATGTAAAAT TGTAACACTA AGGATCCACC CTCCATATTT 3300 

TCATGTTTTA AAGTAATTTG TGTAAGTAAA TGTGTGATAA TAATAATTGC ACATATAATA 3360 

GCACGTAAAT ATACGAGTTC AAGTCTAATC TTTTTCATGG AATCCGTCCC ATCTCTTAAT 3420 

TAAATGCTCA AAAGCATCAT CACTAATTAA TATTCTAGGG ATGTAATAAT CATTGGAGTT 3480 

CGGAGTGACT GCTTTTTCCT CTAATGAAAA ACCGTATTTT AACCCAGCTT TTTTGATTAC 3540 

CGGTAATTTA TCGTCATTCA TCAAGCCATA AGGATAGGCT ATAGTTTTCT GCGACTTTTT 3600 

AAAGTTTTTA GTTAGATATT TTTCACTTTT GTTTAAATCT TTTATGATTG TAGCTTCAGA 3660 

AGCTTTCATT AATTTTGACT TATTATTTTT AGATAAGTTA TGCAAATCGT GGGTATGTGT 3720 

30 TTCAAATTCC CATAACCCAG TTTTATACAT TTCTTTTAGT TCTTTTTTAC TAATCATATC 3780 

GAGGTTGTGA AAGTTTTCTT CCCCAACATG ACCTGTGATA ATAAACCCAG TTGCCGGTAT 3840 

TTTATATTTT TTTAAGATTG GATAAGCATT TTCATAAATA GTTTCATCCA TATCATCAAA 3900 

35 GTTAATCCAT ACACTTCGTT ' TTGGaAACTT ACCTTTTTTC TTGtAATATA AAAATTCTTT 3960 

CAAQGTTAAA AATTTAGCAT CATGTGATTT TAGCCATTTT ATTTGAGATT CAAATTGTGA 4020 

TTGACTAACA CTATAATTTT TAATTTCTTT ACTACTAGAA AAGAAGTAAA TAAAATTATT 4080 

CAGAAAATTC GCTTTTCTTA CACGGTGATA ATTTAATGCC AGAGCACTAT TTTCTTTATA 4140 

TTTCAGTTTT TTAGGTGAAT CGTCATCTGC ATTTGCAATA TGATGACCAT CCAGTGTGCT 4200 

TACAGGCAAT ATGATCAAGA TACTCAACAC TAAAATTATA AATTTTCTAT ACTTCACGAT 4260 

TCTCTTCCTC TCTGCCATTT TTGAATCAAT ATGCTAATTG TAAAAAATAC AAAAATGATA 4320 

ATCGCGAAAA TGCCCATAGT TTCAAATATA TCTAAAATTT CAGTATTTTC AATGTTTAAA 4380 

GCAACACGTA TTGTATTGAT ACTTTCGTCA TGAATTTCAA ATATAGTACC AATATAAACG 4440 

AGTAGAACAA CTAAACAATA TATCCAAAAG ACACAAGATA TAGCGATAAG TGCTGTTTCT 4500 



40 



45 



SO 
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TTGOGTAACC ACCTTTCTTA CGTTTTAATG 
CGTTAATAAT CCAGTATACT GTCGGATACC 
5 TTTTCTCGTA GCGACTATCA ATAAAGAGTG 

TCATAGTAAA TGATGATAGT AGAAATATTG 
AGAAGTTTGC TGTTATGAAC AAATAGCCTA 

10 

TCGAGATGAT TTGCTCAAAC ATCAAAATAT 
TAAAAAAGTC TCGTAGTAAT ACTTCGTGTC 
AAAGACCTCC CAATGTTTCT GGAACCAACA 

15 

TACGATATCC ACGTAAATGC AATTTCCAAG 
TATCCCAGTA GCCAACGTCG ACAACTGCAC 

2Q TAGTATTGAC TGCGCCAGCA AGTGTCTGAC 
ATTCTATCGT TTGAATTTTA CCTAAAATAG 
TAACTGCACC AAGTTTTGGA TCATGTTTGA 

25 GATCAACGAT AGTATCTGCA TCCAAGCACA 

CTTGATTGAG TGCGTTGGCT TTACCTCTGT 
TATTTTCTTT GATTTTATAG ATGAGTTCTG 

30 TAATAATTTC TTTCTTCTCG TATTTGAGTG 

TTTCACTTTC GTTATAACAG GCAAGTAAAA 
TGTCAGGCTT CTTGTTCAAT GAATATCTAA 

35 CGACAATCCA GTAAATAGAC ATAAATACAG 
ATTfCTTTAC CTACCTTTCG TTAGTTAGGT 

AATTTGCAAT AGATTGTTGT TATAATTAAA 

40 

CCTGTAACAT AGTGTGATTA ATTTTCAGTA 

TTGATAACGC AATAACCTTA TTTTCAGAGA 

TAGCTAAAAG TGTAAATATA AAGAAAGCGA 

45 

GTATTTACGA ACAAAGTGTT AAATGTTGTT 
ATCAAAATAA ATCGAACTAT TCAATTGATG 
TCGACATCGA AGAAAGGTAT ATTAGAATGT 

50 

TTTCTGGAAA TATTTACGGA CAAATACAAG 

55 



CTTTTGGAAA TGCGACAAGA ACTACTGCTG 4620 

AACTTACAAA TATGAGTCCA GCCATATTCT 4680 

CGACTGTAAA TTGAATAACG TTTATAAAAG 4740 

AAAAACTATA TGTCATAAAT GTATAGTCTA 4 800 

AATATAGAAG CACTATATAT ACCCATAAAA 4 860 

ATAAAGGAAA CCTTTTCGTT TTCATTGTGC 4 920 

CCCCTTGAGC CCATCTCACG CGTTGCTTCC 4 980 

TCCAACACAT GGCAAGCGGT TCATACTTAA 5040 

AAACTGCAAT ATCTTCGGTA ATCATATCAG 5100 

TTTTTTTAAA TAGAGTGAAG ACACCCGAAA 5160 

TtCGCTTAAT ACAGCCAATT AAACTTGCAT 5220 

AACTCTTATT TCGAATTCTA GGATTACCTG 5280 

AATTCTCAAT CATATAATAT GGTGCATCTT 534 0 

TTACATAATC ATATGAAGCC TGTTTAATGC 5400 

TTTCTTGTAA ATCGACGAAA ATAAAGTCAT 5460 

CTGTATTATC TGAACTTCCA TCATTAATGA 5S20 

CAAGAACATT AGACAACGTA TCTTCAAyCG 5580 

ATGTAATGCC TTCTAATTCA TCCACATTTA 564 0 

TTTCTCTGGT AAAATAGAAA TAAATTGAAC 5700 

GATAAAAAAG CAAAAAGTTA AAAAATTGCA 5760 

TGTAAGCCAT ATGGTAATTG ATAGTATTTT 5820 

CGGAAATATT TGTAATTGCA ACTTAATTTT 5880 

GGGGGTTATA AAAATTGAAG GATAAGATTA 5940 

AGGGGTATGA CGGTACAACA CTTGATGATA 6000 

GTTTATATTA CCATTTTGAC TCGAAAAAAA 6060 

TTGATTACCT TAATAATATT ATTATGATGA 6120 

CTTTATATCA ATTCTTATTT GAGTTTATTT 6180 

ACGTTCAATT ATCTAATACG CCTGAGGAAT 6240 

ATTTAAATCA ATCATTAAGT AAAGAGATAG 6300 
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5 



10 



15 



20 



25 



30 



TGCTGTTTCT 


TGAAAGTTGG 


TATTTGAAAG 


CATCCTTTTC 


GCAAAAATTT 


GGAGCAGTGG 


6420 


AAGAAAGTAA 


AAGTCAATTC 


AAAGATGAAG 


TGTATTCGCT 


ACTAAATATA 


TTTTTGAAGA 


6480 


AATAATTTTT 


GTTACTAGTT 


TGTAATAATT 


AACTTACTTT 


TGTAAAAAAA 


GACATGAGAT 


6540 


TATTTTTTTA 


AATCTATATA 


AAGTTGACAA 


TACAAATCGA 


TATTGAGAAT 


ATTAAGATGT 


6600 


ATATGAATTT 


TATAAATTAA 


ATGCAATACA 


TTAATATAAA 


TATCAATTGT 


TGCAAAATAC 


6660 


GATTTGTTCA 


ATGATTTGAT 


AATATTATTC 


TTTATATTTG 


TGAATGGTTA 


AGTTTGTCTT 


6720 


TGAACATATT 


ATAAAAGTGT 


AATGTTCCCC 


TGAAAAGAAT 


AAGTTGTCAT 


CTAATTACAG 


6780 


GAAATCCGCA 


TAAATTAGAT 


GAAATGGAAA GTAATAAGTA ATAATTTATT 


GATAAGCGCC 


6840 


TATGTGATGG 


TAAATCATGA 


CATAGGCGCT 


TTTTTTTATA 


AGTTAAAAAT 


GTAAATAAAA 


6900 


ATTATATAAA 


TTACCCACAT 


CTTTTTAAAA 


GGTGTGGGCT 


TTATTATCAT 


TAACCCAACT 


6960 


CACAGTGACG 


GGTTACGCAA 


GGTATTGAAT 


TACCGAGTAC 


GGGCACGCTC 


GGTGTTGTAA 


7020 


AGAGCAAATA 


ATCAAGTAAT 


GATGATGCTT 


CTACTCGATT 


ATAAGAAAGC 


CATGATAGAG 


7080 


TACGATGGTA 


TCTAGTTTTA 


TTATTAATAG 


GTTTGGATAT 


TTAAAGTTGG 


ACAATATTAT 


7140 


ATCTTGTGCA 


AAAATATAAA 


TAAGTTATAC 


ATAATGGTAG 


AGAATCATGA 


TATAATTTTA 


7200 


AACGATAAAA 


TATTTATATA 


AATAATTAGA 


GaAAATGTAG 


TTGTGTATGT 


yTTGTGGtCG 


7260 


TTAAACTAGA 


TATAATTGTC 


CGATTTATAA 


AACATACATA 


ATGAATACaA 


TGATTGATTA 


7320 


TGTGGAGGAA 


ACCATGAmAG 


AmAAGTTTgA TTTAGTAAAA CTATTAAATA 


TTCTAAAGAA 


73B0 


GAATATTAAA 


TTATTGCTTA 


TTTTACCGGC 


AATATGTCTT 


GTAGTAAGTG 




7430 



35 (2) INFORMATION FOR SEQ ID NO: 261: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4082 base pairs 
T (B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 
40 ' (D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 261: 

45 

ATTGTTACTC ATTATTTTTT CATATTCACA CAAATGATCT TGTTTATATT TAGCTAATTG 60 

ATTTTTATCT AGCATTTTAT CCTCCTGCTG AGTTTGTAAC CTTTAATAAT TTATTTTCTA ' 120 

5Q TAAAAACTTA GTATTCCAGT TGCTTATTAT ATCATTGATG AAAGGCTGAA ATAAAACATA 180 

AACTGTTCCG ACCATTAACG CTGTAGCTAA AGATAAGTCT ACAAGTCCAC CTGTTTTAAA 24 0 

TTGAATCGGT GTCTTCACAT TAAACGGTAA gGAknAAAAT AATTTCACGC CTTTTGGTGT 300 
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AGGCGTCTGA ATAATTTGCA ATAAAAATGC 
AAAGGTTCGA TGTCCAAAGA TCAATCTCAC 
5 AATCTTACTT TGAGTGTGAC ATATATCGGG 

AACCGTAACC GACGAAAAAA TATCCGTTTG 
CATGCCGCAT GAAGCATGTG TTTTACCTGT 

10 

TACCACATCC CTAACAAAAA CACGAACATA 
AATTTAAAAA AGTATCACAT AACTCTTGAA 

15 ACAAAATATT TAAAGGATGT GTTTGAATAA 
AAGTGCGTAT TCAATGGAGA GTTGCTGATA 
TTACACAAGA CCAAGATATT CATGCAGTTC 

20 TCGGCTCAAC GTTTGGTAAA ACGAATCGCG 

TTATTTATAC TCAAAATGAT CAAAAGGTTT 
AaAATCATTC ATGGTGAGGG CTTCATGAAT 

25 

AAACAAATAC AAAAGGACAA CTGTTCCCAT 
TTTATAACAA AAGATGTGCC ATCAAAGAAA 
AGAAAATCAT AAACAATTTG CCGATGCTTA 

30 

CTACTTCAGA CAAGTATATT AACTGCGATA 
TATCATTTTG TACACCTTCA ATTAATATAG 

3$ TAATCGTTTG AGAAGCCTGT GCCGCTTCAG 

AAGGTTTACC CAATATGACA AAAAAGGGCG 
CAATACTCAT TACTACAGGC AAAATAACAA 

40 ACTTAAAAAA GTCAATAACG CCCGGTGCTT 
CATGTCTCAA TGCCGTCTTT CCTTCTGGCA 
CCTTAGCATA CTCATCAGGA ATTTTATTTA 

45 

CAACGAGGCA GGATACTATC ACTGATAAAT 
CTGTTTCAGC AACTACAATT GCAAAGGTGA 
CTGTTGCCTC ACGACGAGAA TAATATCCTT 

50 

CAACAGTTCC GTCTCCAATA AATGATGCTA 
TAAATAAAGG TCTCATAACC GGTCTAAAAA 

55 



TATGATTGCG ATAAATAATA TTGAATGCGT 420 
AAAAAAACTA ATTACCTTAA ACCTTCTGCC 480 
TAATAAGCTA GCTAGAGTTG CTAGAATGAT 540 
AAAATATTGT GTTGTTAGCG CTCCAACGAG 600 
CATATTTGTT CTCCTTTAAT ACTCACATTT 660 
TTTTCGGGTT AAAATTCATT AGTATGACAC 720 
AACGATTACA AAATCGTTTA TGATGTATTT 780 
TGGCAATGAC AGTAAAAAAG GATAATAATG 840 
TCAAAATTCC TACAAGTGAA ATTAAAAATA 900 
CTAAATTAGA CAGCAAAGAT GTATCTAGAA 960 

TTATTATCGA TACTGAAGAC CACGAATACA 1020 

ACAATGAATT AACTAAATAA ATTGTATAAA 1080 

GATTTTTTTA ATTGATTCAA CACCCAGCAT 1140 

AATTTTAACA GTTGTCCTTT TTCACATATA 12 00 

TAATTGGTAG TGTAATGATT GTTCTAATCA 1260 

CAGGAATCTT CGAACCAAGT ATGACGCCAC 1320 

TACTAAGTGC CCCAATAACA AAACGAGTTA 1380 

AAGGTAAAAA CATATCGGCA AAACCGATAA 1440 

GTATTTGCAT TAACTCTAAA AATGGAACAA 1500 

TGTAGTTCGC AATAATGGTA GCAATAGTAC 1560 

ACCACATATC AATGACTGTT TTTAATCCTG 1620 

TAATACCTAC TTCTGTTGCA GTATCAAAGC 1680 

ATGCCTCAGT ACGCGCACTT TCAGGTACCT 1740 

AAGGCCAAAT TCTTGGCATA ATGACTGCTG 1800 

AGAAAGCAAA AAATTGATTT TGCATGTGCA 1860 

TAGAAACTAC ACTAAATGTC GTTGAAATAA 1920 

CACCATATTG TCTACTTGTA ATTAAGACAC 1980 

AATTATCTAC CGTCGAACGT CCTGGCAATG 2040 

TAGGACCCAA CATCTCTAAC AAACCGTATT 2100 
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AACTTGAGAA CAATAATCCA CCCGTTTCAT CTGAGTAAAT AACCTTTGAA CCAATTCGTA 2220 

AAAATGTCAT CCATGCAAAA ACAACTGCTA ATATTCGTAA AATTAACCAA CCAATTCTAA 2280 

CGTTAAAAGC ATTGTTCATT AGCCCGTCAG GTTTCAATTT ATCTTTTAAA ATAGTTGAAC 2340 

AAATCAGAGT TATGATACCC GATAAAGTAA TTATCGTCAC AATTAAAAAT GGCATTACGC 2400 

CACCTAATAC ATCTTTAAGC ACGCCTGCTA AAAATGCCAC GGGCAACGTT GTTTGCTTCT 2460 

GTCCATCTTG TTCGACTGGA ATTGGTACTA AAAATAATAA GATACCAATT AAAGACATCG 2520 

TAATAAACTT AAGTCTCCCA ATAACTATCT CTTTCCTTGA AAAGCTATCC ATAAAATCAA 2580 

TCCATTTCTC TATGTATTCG TTTTAAGTAT ATACAGAATT CTATTCAGTT AACAAACATA 2640 

TTCCTTATCA TTCTATCTTT CAAAATGTTT ATGTATGCAA AATAATGAAT AATTACAGTT 2700 

ATTAAATATA CGCTATTTCT TGTAATTTTT CAAGATGAAT TCAAAAAAGG TTAAGTACAA 2760 

20 TTACTGATTT CGTACTTAAC CTTTTTTAAA CTCTAATCAT ATGTTAGTTA TTTCATTCTT 2820 

CGTAATAATA TTAAGAAGTA TGGTGCACCG ATAATTGCAA TGATAACCCC AACAGGAATA 2880 

TCCAGTGGCG GATGAATGCC ACGGGCTAAA CCATCTCCAA ATGTTAACAA TATAGCACCA 294 0 

ATTAACCCCG ACATGATAAT AACGTGTAAT GTTTTATTTC CTATTAATTG TCTCGCAATA 3000 

TGAGGTGCAA TTAATCCTAA AAAGCTAATA CCACCGACAA CTGAAATTGC GGATCCTGCT 3060 

AATATTACTG CTAAAATTAA CAATAGCATT TTAATAGTTT TAACTTTTAA ACCGAGTGCG 3120 

GTTGCAACAG CATCACCTAG ATTCAATACA TCTAATTGAT AACTCAATAA AATGATGATT 3180 

GGTATCGTTA TTAAAAACCA AGGTAATATA GTATAAATAT TCGACATATC ATGTCCATAT 324 0 

AGACTACCTG TCAACCAAAC AAGCGCTTTG TTTGCTTCCA GTGGATTTCT GATTAATAAG 3300 

AACTGCACAA TCGCCGTACA TATTGCGCCT ATTGCTAAAC CAATTAAGGC AAGCTTTGAA 3360 

CCTI^AACAT CATATTTTGA AATTAAAAAT GATAAAAATA AACTTACTGC AAAGGCACCT 3420 

40 AAGAATGAAC CTATAGGTAA TACAAACAAT GGTGCTGTTG GAAAGGTCAT AATAATAATC 34 80 

ACAGCAGCTA AACTGGCACC TTTAGAAATA CCTATAACAT CAGGTGAGGC TAACGGGTTT 3540 

CTTATTACAG CTTGTATAAT TGCACCTGAA ATAGCCAAGC TACTACCGAT AATAATACCA 3600 

AGTAATGTTC TAGGTATACG ATACTCATTT AAAATAAAAT CATCTTGTGT AAAGATTCCC 3660 

TTAATAGCAT CAATCGGATG AATCATGACA GACCCTACAC ATAAACTTAT GAATATACTC 3720 

ACAATTAAAA GGATTGTGAT TAAACTATAA CGACGTATAA TTTTCGTTGT CATCATATTC 3780 

TTTTCACCCC TTTAATCGTT ATAAATAAGA AGTAAAGTGC ACCTACGAAT GATGTAACAA 3840 

TCCCTACTGG TGATTCATAA GGATATGTAA TTAAACGACT TAATACATCT GATAGTAGTA 3900 

55 



25 



30 



35 



45 



50 
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AGCGTTTGAC TATATGCGGT ACGATTAAGC CAACAAATCC AATTGGTCCT GCCACTGACA 
CCGACATACC TGTAAGAATA ATGACTAATA GTCCAATGAT AATTCTAACT TTATTTATAT 
TT 

(2) INFORMATION FOR SEQ ID NO: 262: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1145 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 262: 
TATTAGAAGG TCGTTCGGAT GAACAATTAA AAAATTTAGT TAGCGAAGTA ACTGACGCCG 
TAGAAAAAAC AACGGGGGCA AATAGACAAG CAATTCACGT TGTTATAGAA GAAATGAAAC 
CAAACCATTA TGGTGTGGCT GGCGTAAGAA AGTCAGATCA ATAATTCTTC ATAAGATGCA 
TGCCAATTAA TTCTTTGAAA ACGAACAAGG CGACTTCTAT CTGaGTATGA TAGAAATCGC 
CTTGTTTATT TTTAATCTTC ATCTAAAAAG TCTTTAATAG CTTGTTTATT TGTGTTTTTA 
TTAATCTGTA ATGCACTACC ATCAGTATTT GTATTGACAT CyTCGTATGA GTTCTTGATT 
GGCaCAGTCA ATGACTTAAC ATCTTTTTCA CCTCGGATAC CaAAACTCAA ACCTGTTTGG 
AAAATCCCTG AATCAGGAAT GTTTGTATTC ACATAGCCTC TTAAAATACC TGCAACTTTT 
GGTAATTTAA CAACTGTTCT AAAATTAACC ATTTCTTTTT TCAATGTTTG CATCACTTGT 
TGCTGACGTC GCACGCGTCC GAAGTCACCT TCAGGGTCGT GACGGAATCT TGCATAACCA 
AGTAATTCTT TACCATTCAA CCTATGGTTA CCCTTTTTCA AAGATACACC AATATTTTTC 
GACATATCTT TTTCGACATT AATTGGTACA CCTTCAGGCA TTAATTCATC AATCATTTTC 
TCAAATCCAG TAAAATCAAC TACTGCATAA TATTCAGGAT TAATTCCTAA ATTTTTATCA 
AGTGTTTTTC TAAGTAGCTC TGGACCACCT AAAGCGTATG CTGAATTAAT TTTGTGTTTT 
CCATATCCTG GAATATCTGC ATAAATATCA CGCATGACAG ACATCATTTT CATCTTTTTA 
TTGATAAAGT CATATTGAAC AACCATGATA GAATCTGTTC TTGATTGTCC ACCTTGTGCT 
TTATCTGCAC CGAGTACAAG AATAGAAATT nTACCATCAT TTTTTACTGG TCCATTAAAT 
TGATGTACTT TAACATCTTT CGCATGTTTC TTGGCATATT CTACACCGCT ATTGTAACTA 
TGTACAATAT ATACAACTAA TGCCGATAAG TAAAATTACA ACAATCAGAA GAATGATAGG 
TAATT 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7075 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
5 (D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 263: 

10 

TATGGCTCAT CATTAATGCA CGTATCGGGT AGCGTTTACC ATTGATAAGT GCTTCATGTT 60 

TAGCACGAGT TCTTAAAATT CCATCGCCAT AACCGATATC AACTACAGCT AATTTTGTAT 120 

TGTTTTTAGT CACTTCAAAG GCAAAGCTAT AACCGCAATA ATCACCAGCT TGTACTTCGC 180 

15 

GCACTTGAAT AACATGTGCT TTTAAAGTTA ATGACTGAAC TATATCATGT TGATTCAGTG 240 

AACTATATGG TCTTGAACCG TATAACGCAA TACCTACACG CGCATGTGTA TGGTGGGGTA 300 

20 GTAATAyyyg TCCTTCCCGA TAAAAACTCG CACTATTTTG AGCATGGATT AGGTCGAACT 360 

GATAACCTTC AGATAAAAGT GCTTCAACAA TTTCCATCCA TTGTGAACGT TCAACATTAT 420 

AAtCTGACAC ATCGAATTCA TCAGCATATC CAAAATGGGk CCATAAACCA CTAATAATCA 4 80 

25 TTTTTGCATT TTGATTATGA TGGTGATCTT TCAATACTTC TTTAATTTCG TTTAAATCTT 540 

TAAATCCAGA CCGATGTAAT AAATTTTCAA ATTCTAAGTG AACATGAATA CCAGCTAAAT 600 

CATTTTTATG GTTATAGTAA TATGTCAACG ACGGCAAAGT CATGTGTATT TGATGTTCAC 660 

30 

GGACTAAATC AAACTCGTAA ACTGCATTCA TTAAAAAGAT TGTTGCATCT GGAGCAAGTT 720 

GTCTAATTTG AATTGCTTCT CGTAGTGATG TTGTGCTAAA TGTATCTATA CCTGCATGGA 780 

TAAACTGAGT TACAGCAAAT TCTAGGTCAT AGTGATATGC ATTaTTTTTA ACAACTGCCA 840 

35 

TTAATGGCTG ATTGTTTTTG ACTGTGATTG CATTTTGTAA AAATATTTTC TTATTTACAG 900 

ACCATGTTGC TGTCAATGTA TTACACCTCT TTGTAATTAT TTAATAAATT TTCGTAAAAA 960 

40 TTAACCACGT TTATTAACAC TTTTTCATCA AAATTTAAAT GTGATGTGTG CAAACCAGTT 1020 

ACAAAACCTT TATCTTCATT TCGTGTTCCT ATAAAAACAA AGTAAGCTGG AGCTAGTTGT 1080 

TGACCATAAA AACTAAAATC TTCCCCAAAT AAGAATGGCG TTGGTTTGTC ATAGACATTT 114 0 

45 AAATCAGCTT TTATTAAGGC GTCCTCTATT TGAGTACGTA ATTTCGGACT ATTGATTGTA 1200 
GGGGGATAAC CTTCTGCAAA TTTAACTTCA CAATCTACAT TAAACAGAAG CTTGACACTT , 1260 

TCTGCTATCT TGTGCATTTG ATTTTTAACG ATTGTTAAAT CATCAATATC ATATGTACGA 1320 

50 

ATAGTACCTT CTAAATAGCC ATTACTTGGT ACAGTGTTAA TCGCTTCACC AGCTTTAAAA 1380 

TGACCAATAT GAACAATATT TCGTTTCAAA CCGTTAAGGT GAAATTGTTG AATTTGTGAT 144 0 

55 
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ACATGACTTG ACAGGCCTGT TAAGAAAAAG CGATACTCTG TTGCGCTGGC CGTAATTTCT 1560 

TCATCTCTTA TCACTGCAAT GCCTTCATCA GCAAATGGGT TAACATGAAT ACCAAATACC 1620 

5 

GCTTCAATTG GATACTTATC AAAGGCACCG GCTTTTATTA ATCGATTTGC ACCGCCACCA. 1680 

GTTTCTTCTG CAGGTTGGAA AATGAAAACG ACATTTTGCG GTAATTGACC TGCATCTTGC 174 0 

ATGTCTTTGC AACGTTGTAC AAAAAGCATT AATGCAGTTG TATGACCATC ATGTCCACAA 1800 

GCATGCATCA CATGATCAGA TTGACTGCGA TAAGGCACAT CATTTTCCTC TAAAATAGGT 1860 

AACGCATCAA TATCAGCTCT ATACGCTATC GTATGTGAGC CATTACCTTC TAAGTATGCA 1920 

15 ATGACGCCAG TTTCCAATGG GCAATCGTAT TTAATATTTA AACTATCTAA AAACGCTTTA 1980 

ATATAAGCAG TTGTTTCAAA TTCATGTAAG CTTAATTCAG GATGTTGATG TAAATGACGG 2040 

CGATGTTTCG TAACAAATTC TAATTCATTC ATAATTATCA ATCCTTTGTG TTAAATTACT 2100 

20 

ATATAAATAG TGTAACGtAT TTCGAAATTT GTGATCATAA GTTTATTCAA TGCTAAACAA 2160 

TAAGGTTGAG ACATAATCGT ATCTCAACCT TGAAATTATT ATACGTTGAC GTCACTAGTC 2220 

ATTCAGTTTT CTTAATGCTG CTACAATCTC TTTTTTAGTA TCTTGTACTT CAGAAGCTTG 2280 

25 

CTTAATCACT TTTGCAGGTG TACCAGCAAC AACTGCACCA GCTGGTACAT CTTGTGTCAC 2340 

AATCGCGCCA GCTGcAACAA TAGCACCTTT ACCAACACGT ACACCTTCTA AAATAACTGC 24 00 

ATTTGCACCG ATTAATACAT CATCCTCGAT TATAACCGGT GAAGCACTAG GGGGTTCAAT 24 60 

30 

CACACCTGCT AATACTGCGC CAGCCCcTAC ATGTACATTT TTACCAGTTG TAGCACGACC 2520 

ACCGAGAGTA GCATTCATAT CAATCATTGT ACCTTCGCCA ACGACTGCGC CAATATTAAT 2580 

35 TGTTGCGCCC ATCATAACGA CAGCACCATC TTCAATAATG GCTTGTTCTC TAATAAACGC 264 0 

ACCTGGTTCA ATTCGTGCAT TCGTATTTGT TAAGTCTTTT AATGGAATAG CAGAATTGCG 2700 

ACGATCCATT TCAATTTCTA TATCTTCGAA TTGACTACCA TATGCTTCGT AAAAAGGTTT 2760 

40 CCAATCATCC GCTTCACAAA AGATTACTTT AGATTGTTCT GAACCAAATA CTTTAAAACT 2820 

TTCTGGATAT GTGATGCCTT CAAAATTACC ATTTAAATAT ACTTTTATTG GTGTAGACTT 2880 

TTTAGCATCA CTTATATATT GAATAATTTC TTCAGCTGTT AAATGTTGTA CCATAAAATA 294 0 

45 

ATCGATCTCC TTTAATATGT TTATAAGTTG TCAAACGTAT AAAAGCCGTT TGGTTTATTA 3000 

ACTAAGCGTT CTGCTGCTTG TATTGCACCA TTCGCAAAAA TATCTTTTGA TTGTGCACGA 3060 

SQ TGCGTGATTT GAATCGTTTC ATCAGTGCCA GCAAATAGAA CTTCATGTTC ACCGACAATC 3120 

GTACCTCCAC GAATAGAATG TATACCAATA TCTTGTGGCT GGCGTTTTTC ATTTAATTCA 3180 

TGTCTATCAT ACACAGGTGT TACATTTTCT TTCAAAGATA CGATCACATC ATACAATTTT 3240 

55 
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TCGAAATCAT CAAGT AGGGO AACAGCAGCT GCTAAAATTT TAGTCAATGC ATGAACGCCA 3360 

TAACTCATGT TCGCGCTGAA AAACACAGGC ATATTTTGAC TCAATTCATC TAACTTATTA 3420 

AGTAGTTTTT CTTTCTCGnC CAGTgTTGCC ACAACTAATG GCAAATGAAA ATCTTCATCT 34 80 

AATAAAGGGA AAAGCAGATT TGGATTTGAA AAATCTATTG CAACATCGGC ACCTTTAACA 3540 

TCTGCAATAT GTTGATATTG TTGATATGGC GTTGTTGCTT TCGGTGTATT TTCAATGACC 3600 

10 

CCAACGATTT CATGTCCTTT TTCTTCTGCT AATCTAGCAA CGCGTTGATT CATTGCGCCA 3660 

TAGCCAATTA GTAATATTTT CACTCATTTT CACCCGCTTT AAATGTGTCA TATGTTTCAC 3720 

75 GAAGCACTTT AGTATCTGTA TCTTCTAGGC TAACCAATGG TAGACGTAAT TCATAATTTC 3780 

CAAATCCTAA ATAACTTGTT AGAGCTTTAA TAGGAATTGG GTTAATATCA ACTGATAAAG 3840 

CTGATAACAG TGTGCCGATT GGTTTAAATT GATCTTGAAT ATCTAATCCA CTTTGTTGAG 3900 

20 CATCGTATAA CGCTTGAAAT TCTTTAGGAA TGACATTGGC AATAACAGAG ATAACCCCTT 3960 

GACCGCCACG TTGATAGTAT TCGACGACGT TGTCATCATT GCCACTATAT AATGCAAATG 4020 

AATTTGTATC AATGCGCTTT TTCACTTCTT CTAAATACTC AAAATCATTC GTAGCATCTT 4080 

25 

TTAAAGCAAC TATATAAGGA TGTTGACTTA ATATTTCTAC AGTTTCTGGT TCAATTGTCA 4140 

TGTTCGTTCT TGAAGGAACA TTGTACAGCA CGACTGGTAA TTTCACAGCA TCTGCAATCG 4200 

CTTCAAAGTG TTTGACTAAA CCACGTTGGT TCGTTTTGTT GTAGTAGGGC GTAATTAACA 4260 

30 

TAATTGCATC AGCCCCTAAG GCTTTAGCTT GGATTGAAGC TTGGATTGAC TTTTCAGTAT 4320 

CATTAGTGCC AGTTCCTGCT ATGACAGGAA CACGTTTATC TACAAGATCA ATAACTGTTT 43 80 

55 TTAGAATGCG TTCTTTTTCA TCTGTTGTTA AAGTAGGGCT CTCAGCAGTA GTTCCATTAA 4440 

CGATGATTGC TTGGGCATTA TTTTCTAGTA AAAAATTAAC GTGTGTTTTC AAAGCTTCAA 4500 

TATTAACTTT GTTATTTGTA AAAGGGGTTG TAAGTGCaAC sCCAACACCC TCAAATAAAT 4560 

40 GTGTCATTTT AATTCGCTCC TTTTAAACGC ATAACTTGTT CCAATACTTG TACAGCATTT 4620 

AATGCAGCAC CTTTTAATAA ATTGTCTGAT GTACACCATA CATGGAAAGT ATTTTCTAAT 4680 

GAATCATCTC TACGTATACG GCCAACAAAC ACTTCATCTT TATTAGTAGA ATTGATTGCC 4740 

45 

ATTGGATATT CATTGTTCTC TGGATTGTCT ACTAAAACAA CGCGGTCATC TTGATCAAAT 4 800 

AACGCTTTAA TATCTTCTGC TGTTGTTTCT TTGTCAAGCG TTACATCAAT TTCAACACTA 4860 

TGACTATCTT GAACAGGCAC ACGTGCGCAT GTTGCTGTTA CTTTTAAGTC TGGCGCATTT 4 920 

50 

AAAATTTTTC TCGTCTCATC AATCATTTTT TGTTCTTCTT TTGTATATCC GTTTTCTAAA 4 980 

AACACATCAA TATGCGGTAA CACATTATTA TAAATTGGAT GTGGATATGC TTCTGGTGCT 5040 

55 
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70 



TGATATGTTG TATATGCCAC TCGTTTTAAA CCATAAGCAT CTTGCAATAC TTTTAGAGGT 5160 

ACAACAGATT GAATCGTAGA GCAGTTTGGA TTGGCAATGA TACCTCTTGT AAATGTAGGT 5220 

TCATTGACTT CCGGAACGAT TAAATCAATA TCTTCTGCCA TACGCCATTG ACTTGAATTG 5280 

TCTATAACGA TTGCACCAGC TTTTTCAAAA AGTGGGGCAA AGTGTTCGCT TGTACCGCCA 5340 

CCAGCACTCA TTAATACATA ATCGAAATGT TCACTTGCAC GAGCATCAGT TAATTCTTGA 5400 

ACTGTATATG TTTTTCCTTG AAATTCAACT TCTTGCCCTG CAGAACGTGC TGATGAAAAT 5460 

AATACTAATT CATCGAAAGG AATATTTTTA CGATTTAATG TCTCCAACAT TTTTGTACCT 5520 

15 ACTAATCCTG TTGCACCCAC AACTGCTAAC TTTGTCATAA CTTGTCACTC CATTTTATAA 5580 

TAATTTCCaA TTTTTAGAAT ATTTTAACAA TCATTTTACC ATTAAATGTT AAATGCGTCA 5640 

TATAGTTTTT CTACCGCTTG TTGCCCATTA AAATCATCAA TGACGTATGA AATACTTATT 5700 

TCAGATGTTG TTGTTTGGTA GAAAGGTATA TTATTTTCAA TTAATGTCAA AAATGCTTTT 5760 

GATGCCACAC CTGACATATC ACGCATGCCT GAGCCAATTA ATGAAATTTT GACATAATGC 5820 

TCATTGATTT TATAAGCTAA TGCTTCATAT TGATTCTTTA ATGTTTCAAG AATCATAGAA 5880 

ATTTGATGAA AATCACTATC TTTAATCGTG AAGGATAGTT GTAGCCCATC CAAGTTGACG 5940 

ATTTGTGAAA TCATATCAAC ATTTACAGCA CCTTCTTCAA GTTCCGTAAA TAGTTGGGTA 6000 

AGTAGCTGAT TGTCAGGTAG GGGATAACTA ATTGTTACAT GCATCATATG TTTATCCAAA 6060 

GCCACACCAG TAACTGCTTT TTTCTCTAAT ATTTCTTCAT TTGACATAAT CCATGTTCCT 6120 

TTCACGTTCG ATAAAGTTTT TCCTAAATAT AAAGGGATAT TATAGTTTTT AGCTAATTCA 6180 

35 ACACTTCTTG TTTCAAGTAC ACCAGCACCT AAAGCGCTCA TTTGCATCAT TTCTTCATAT 624 0 

GAGACGATGT CTAGTCGTTT AGCCTTTGGT AAAAGTCTTG GGTCAGTGGC ATACACACCA 6300 

TCAACGTCGG TATAAATTTC ACAAGGTATT TGATTACTAA CAGCAAGTGC CACAGCGGTC 6360 

GTATCAGAAC CACCTCTGCC TAAAGTTGTT AATTCCTGAT GTTCATTGAT GCCTTGAAAT 6420 

CCAGCAACTA CTAAAATATC GTTTTCTTGA AAGGCTTGTT CAAATGTTTG AGGATTAATT 6480 

TGAGCAATTT TACTTTTTAA ATGATGGCCA ATGGTTTTAA TACCCGCTTG ATAGCCAGTC 6540 

ATTGCTTTGG CATTCATACC GATATCATTT AATACCATTG ATAAATAAGA TACAGTTTGT 6600 

TGCTCTCCGG TTGTCAATAA TAATGCCAGT TCTTGTTGTT TTGGTGCTTT AGTCAAGGTT 6660 

GATACATTCG TCATTAATTG ATCTGTTGTG TTACCCATAG CACTTACAAC GACAATTAAa 6720 

TTGTTCATCT TGATTGACTC GCTCCTTTAA CATTTCAGCG ATCCTTTTTA TTTTTGTAAA 6780 

ATCACTGACG GATGATCCGC CAAATTTCAA CACACTTCTT GTTACCATAT AATCCTCCTA 6840 
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TAATCTATAT ACAAGTGATG CACTCCATTA TTTTTAAATA ATGACAAACT CTCAGCTCTT 6960 
AACCAAAAAG TCCAACAAAT TATAACTGCT ATTATAATTG CTTCGGCATC GCACCCTTTC 7020 

5 

AAATTTAGCT GTTAGCAGAC AGTAATCTAa ACTTTACTCA TGATTGATGC GCCTC 7075 

(2) INFORMATION FOR SEQ ID NO: 264: 

(i) SEQUENCE CHARACTERISTICS: 
10 (A) LENGTH: 5171 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 

15 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 264: 
AGACGTACTT TGTGATTmCG AAGyrCGTAC TGmAGCACTT GTCGACGTTG ATGTACTTGT 60 
20 TGAACCTGAT TGACTAGTAC TTTGTGATAA TGACTTACTA TCAGAATCAG ATGTACTTTG 120 

TGAATCACTT AATGATTCTG ATGTACTACC TGACTGAGAC GTGCTCATTG AACTACTTAC 180 
GGACATTGAT TTACTGTCTG ATGCAGATAA TGACCCACTT GTACTGATAG AGTCACTTAC 240 

25 

TATCTCTGAA GTACTCATCG AGTCTGATGT ACTTGTTGAG ACACTTTGTG ATGCTGCTAT 300 
GCTTAGTGAT CCAGAAACAG AACCACTTGT GCTCGTCGAA TCGCTCAATG ATTCTGATGT 360 
ACTCATCGAT TTTGAATCAC TTGTACTTAA TGATATTGAT GTACTTTGTG AATCTGATTT 420 

30 

GCTTGTTGAC GCACTTTGAG AGTTGGCTAT GCTATTTGAA ATACTGATAG AGTCCGAGGT 4 80 

GCTAGCTGAC TCGCTCAATG ATGTTGATGT ACTAATTGCA TTCGATGTAC TGTCACTTAA 54 0 

35 TGATGCTGAT GTACTAGACG ACCCTGATAT ACTCGTTGAT AAGCTTTGTG ACTTAGACAA 600 

GCTTCCTGAT GTACTCATAC TTAATGAGTC ACTGAGTGAT GTTGATGTAC GCAATGAATC 660 
AGATSTACTT GTTGATAGAC TTTCGGATTT TTCAGTACTG CTAGAGTTTG AAATAGAATC 720 

40 GCTTAATGAT GTTGATTTAC TAGCTGAATC CGACATGCTT GATGATACAC TTTGTGAATT 780 

CACTAAACTT GTGCTTGTTG AGCTTGATAC ACTATTACTT TCAGATGTGC TTAATGACTT 840 
AGATGCACTC ACAGAATCAG ATAGGCTTAC ACTTGTCGAT TTCGAGGTAC TAGCTGATGT 900 

45 

AGATACCACA AT CG ATCCTG ATGTACTCGT TGATGCACTT TGTGAGTCAG CTTTACTTGT 960 
TGACACACTT TGAGATTGTT GTGTACTTCC TGATGTTGAT ACGGAATCAC TCATGCTATT 1020 
TCTTGTTACT TCATATTTAA AAGTTGTCGT CGTTTTGTTA CCGCTCGCAT CTGTAGAAAC 1080 

50 

GATTGATATA GTACTTGTAC CAATGTTTGT TGGTGTACCA CTAATAGTAT TATTTGTACT 1140 
ATCAAATGTT AGTCCGGATG GCAATCCAGT CACTGTATTC GTCACCGCAT TTCCACTGTT 1200 

55 



1070 



EP0 786 519 A2 



ATTGGTGTCA CTGTTGGTGC TGTCGTATCC ACAACATTTA TTGTAAAAGT TGTCGTCGAT 1320 

TTGTTATTTG CTTGGTCAGT AGACACAACT GTCACTGTTG ATTGACCAAT TTTTGTTGGT 1380 

5 

GTCCCAATGA TTGAATTCGT TGCACTATCG TAACTTAATC CGCTTGGTAA TCCTGTAACT 144 0 

GTATTTGTCA CAGTCCCAGT ACCATTATCC GTTGTAGTCA ATACAATAGG ATTCATTGTT 1500 

TTACCCACTT CTATGGTTTG ATTGCCTACA GTTACAGTTG GTGCTTTTAC ATCAGTAAAA 1560 

10 

TAATATGTCA CTGATTGTCC AGCATTCGTC ATTTTTACAG TTTTATTTGT ATCATTATAA 1620 

GTTGACGCAT ATGAACTATC GACGGACGTG TAGTTATATC CTTTAGCAGT CAATGCAGAT 1680 

15 TGCTGaTTAT CGATTGTCAC GACTTGATCA ACATTTCCTG AATATGTTTT TGGTGGAATA 1740 

ATATCTTTAC CTGTTGTTAC ATCAACGTAT CTCACTTGTG TAnCAGCAGA CTCTGTATAT 1800 

TCGAATGTTC CAAATTGTAC TTGTTGTAAA TTTGTCGCGC CACCTGTTGA GGCTGTCATT 1860 

20 GATAATGAAA AGTTGGTCGT ACCACTTTTC GCAATCCAAT CTGAAATATT ACGTGTCCAT 1920 

GTTTGACCTG CATATTTGAC AGTCATAACC TTTGTATCAC CATTATAGTT AATATCAAAA 1980 

TCTTGGaACG TGTTATTTGT AGGTTGaACA TTTAACTTCG CAGCATTATC AGCTGTTGAA 2040 

25 

CTTGATGTAT ACGTTGTCGC AACACCATAA CTATCTGTTG TTACAAATGC ACCAAACGCA 2100 

CCTCCACCAG CTACATTAGA TGGGTCAGCA TTCGCCTTTG CAGCTGAATT TGGTTTAGAT 2160 

GTATTGTGAT ACGTATCCAA TTTGAAGCCA AATGCGTTAC TTAAGCCACC AATACCTACT 2220 

30 

GCGGCACCGT TTAACCCTGT TTCACCTAAT ACACCTGGTG AAAAGGCAAA ACCGATACCA 2280 

TCTCCACCAT TTCCATGCCC TTCATATTTG TTACCTAAAT TTACTTTTCC AGAAAAATGA 2340 

3S AAACTCTTAT TAGAGTCAAT ACGTGTTCCT AATGTAATAG CACCTTTTTG GCTGTATGCA 2400 

TCCTGTGTTA ACGTCACAAT ACCGGTACTT TGATCATAGG TAGCATTACC TGACGTTGTC 24 SO 

ATATATTGTT TTAAGTTATC TTTATTAACT GTAATTGTAT TAGCAGTTAC TGCGGTTGTC 2520 

40 GTCgCTGctG ACGCAAATGT TGACATAGCT AAGCGACTGA AAGTTCGAAG TTTTACTGGT 2580 

GCGGTGCTAG TTGACGTTGT GCTAGTTTTG TTTAAGTTGA CCGAAGATGG CGTTGTGCTT 2640 

TGTGAAGTGT TATTTGATGC AGTACTTTGA TTTGTTGATG TATTAATTGG TTGTTCTGTA 2700 

45 

CTTGAAGTTG AAGCTACAGA TTTAGTATCA GAACTTGATG TAGTATTCTT TGAGGATGTT 2760 

GATTCTGATG TAGATGTCAA TTTCTCTTGT TGATTGCTTG TACTATTAGT TGTCGAAGTG 2820 

ACCTTTTCAG ACTTTTCACT TGAGACTGTG TCACTATTTG ATGTTTGTAC CGAACTACTA 2880 

SO 

TTTtTCGTTA CACTTGTGGA ATCGGCTGTT GATGTTGATG CTTCGATTGT CGTTGAGTTT 2940 

TGATTACCTA CTGTTTCACT TTGTGTGTTT AATTCAGAAG TTAATGGTGC ATCAGAAGCC 3000 
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GTTTTCAGTC CGTATCCCGT CATTTTTTTA CTAATGCTTT GATTATCTTG ACTCACTAAA 3120 

CTATGACTAA TAAATGGTAG CCCCATAATT TTGAACATTT CTATTTCTTT AATTCCGGAT 3180 

TTTACCCAAT TTTTTCCAGA TTTATAAAGT CTTACTCTTG TTTTTTCGTT TGCTAAGCTG 324 0 

TCATGAAATG CTTTCTGTCT TTTACTCATG TAATAACTCC TTGTATTATC TTTACATTCA 3300 

TTAGATTATA ATATATGCCA CTATTCAATT TAATACAACT CTTTTTTGAT ACAAAAATAC 33 60 

TCATTTTGTT AAAATTTGTA AAAATTCaTT TTTATTCGTC TAAATGTAAT CGTTTTCATA 3420 

TTTTTAAAAT TACTTTTTCT CGTTTATGCG TATAATCTTT TTTTATATAA ATTTGGCTAA 3 4 80 

15 TTGGCTTTAT GTTTAATCAT TATAATTGTT TCGTTTTTAA AATAATTATT GTATTAATAT 3540 

ATCTATACCA TCCACCTTTT ATTTATAAAT AGTTAATTTA CAACTAAACG ATAAATATTA 3600 

TATGCAAAAT ACATCTTTAA TATTAAAGTA ATACCAATAT TTTTTCAATA AACCTAGTGT 3660 

AATATATGTG TAATTCTAAA AGATTCTTCT TTAAAAATAT AAATACCACG ACATATTGCT 3720 

TTAACATTTT CATTTATAAA GCGAAAAAAT GCATCGCTAC TAAGTTGAAT GTTTAGTAAG 3780 

GATGCATTGA ATTCACTAAA ATGATTAAAT TACTTATATC TTTTCATCTG ATTGATTATC 384 0 

GAAATTTCTT CCTTCTAAAC CTGCTAACTC TTCTTTAGAA GCTGCAGGTG CTTTCATTTC 3900 

AAATATCTCA TTCACTACTG TGTAATCGTA ATATCCTAAT CTGGCAATAG GTTTAATCGA 3 960 

CTTAATGTCC AATTTACCAT TATCAAGAAT AACCTTATCG TCAATATGAA CTTGGGCAAC 4 020 

TCTTCCTATA ACAATATCTA CGGTAGATAC TGGATCTCCA GTTGGAATAC GAATCGTTTG 4 080 

AACGTACTCA CATTCAAAAT GAACTGGCGA TTCTTTTACA CGATATCCTG GAGCTTCTAT 414 0 

35 ACATTTTTCC TTTGTTACAC CTGCAAAATT AAATTCATCC TCTTCTGGTG GCAATGCTTT 4200 

CGATGATAAA TTAACTGCTT CTCTTAAATC ATACGTTGCC ATATTCCACA CAAACCAACC 4260 

TGTCTCTTCA GCATTTTTCA CTGTATCTTT ACGTTCGTGA TCACCAAGAA CGGATTGATT 4320 

TGCTGCGAAC ATAACCATAG GCGGATCCCA AGTTAAGTTT TGATACTGAC TATAAGGCGC 4 380 

TAAATTATCT TTCCCATCTT TCGATACAGT AGAGATCCAC CCTATTGGAC GTGGTACTGT , 4440 

ACTACTTTTA AATGGGTCGT GCGGTAAACC ATGACTTCTT ACACCTTGTT TTGGCGAATA 4500 

ATTCATACTA TCTTCACCCC TTATAAGTAA TTACATTTAA GGTTACGCCC TCTTTACATA 4560 

AGCGTCTAAT ATAAATAAAC AATTTATTTA TAAGTAGAAA CTATATATGA CGTGGTTGCT 4620 

TATAATTTGC GTTCTTGATT CGAAAAATTC AGATAAGGAT TTATACAATT AATATTTATG 4680 

ATATCTTTTG TAAATTTAAT TAATTATAGT TACTTCAATC ATGATTAGTT TATAATAATA 4740 

AAGTGAAATT GAAAAAGACA GCTATTATGC GATGAGCGAA AAACTTCAAG TAAAACAAGA 4 800 
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TAAGTTCAAA AAAGAATTCA AACCTGTTAT GCACTTAAAA GGTGATGCAT TCAATCAACA 4 920 

GTTACAATCT TTGATTAACA AATATCCACA AATACAAAAA AATATGAAAT CAGAGTTCAT 4 980 

5 

TGCTTATTAT GATAAAGAAA AAAATAGAGA AACAGTAAAA AACTATGCTT GGAACCTTCA 5040 

AAAATCTATA AATGACATTA TGCAATCATA TCCTAGCACA AAATTTGTAC AGTTTTATAA 5100 

AAGATGATGT TTCCCCGTCA ATGGTAGATG GAAATGGCCG TTTAAAATCG GGATACTAAT 5160 

10 

GTATTTCCAT C 5171 
(2) INFORMATION FOR SEQ ID NO: 265: 

1S (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3589 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

20 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 265: 



25 



30 



35 



40 



45 



50 



CTACACACTA 


AACCTATTTC 


AGTTATGGGT 


GGTACAGTGA 


TTCTCTTTTC 


ATTTTTAATA 


60 


GGTATTTGGA 


TTGGTCATCC 


TATTGAAACA 


GAAATCAAAC 


CACTTATTAT 


TGGTGCGATT 


120 


ATTATGTACG 


TACTTGGGCT 


TGTAGATGAT 


ATCTACGATT 


TGAAACCGTA 


TATAAAATTG 


180 


GCTGGTCAAA 


TTGCCGCTGC 


CTTAGTAGTT 


GCTTTTTATG 


GTGTGACTAT 


TGATTTTATT 


240 


TCGTTGCCAA 


TGGGTACAAC 


GATTCATTTT 


GGATTTCTTA 


GTATTCCAAT 


TACTGTGATT 


300 


TGGATTGTTG 


CTATTACAAA 


TGCAATTAAC 


TTAATTGATG 


GACTCGATGG 


TTTGGCGTCG 


360 


GGTGTTTCkG 


CAATCGGACT 


CATTACAATA 


GGGTTCATTG 


CAATTTTACA AGCTAATATT 


420 


TTCATAACGA 


TGATTTGTTG 


TGTTTTATTA 


GGCTCTTTAA 


TTGGGTTTTT 


ATTTTACAAT 


480 


TTCCATCCTG 


CCAAAATATT 


TTTAGGTGAT 


AGTGGGGCTT 


TAATGATTGG 


ATTTATCATC 


540 


GGATTCCTTT 


CTTTACTCGG 


ATTCAAAAAT 


ATTACAATTA 


TTGCATTGTT 


CTTCCCAATT 


600 


GTTATCTTAG 


CAGTTCCATT 


CATTGATACT 


TTGTTCGCAA 


TGATTCGACG 


TGTGAAAAAA 


660 


GGGCAGCATA 


TAATGCAAGC 


TGATAAATCG 


CATTTGCATC 


ATAAACTATT 


AGCTTTAGGC 


720 


TACACACATA 


GACAAACAGT 


ATTATTAATC 


TATTCAATCT 


CTATTTTATT 


TAGTCTTTCG 


780 


AGCATTATTT 


TGTATGTATC 


GCCACCATTA 


GGTGTTGTAT 


TAATGTTTGT 


ATTAATCATA 


640 


TTTAGTATTG 


AATTAATTGT 


TGAATTTACA 


GGATTAATAG 


ATAACAACTA 


CCGACCAATA 


900 


TTAAATTTAA 


TTAGTCGTAA 


GTCATCTCAT 


AAAGAGGAAT 


AGGGAATGAA 


AGCATAGCTG 


960 


TATGGGATAA 


TTTGTATTAT 


ATGGCTTTAC 


TCTTTACAAT 


TTTTTTGTAT 


TAAATTTCAA 


1020 
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ATTTACCGTC TTATGATAGT GCTTTTTATT 
GCTTTGGAGT TTCTTCAGTC AAATCGAAAT 

5 

TAAACGCTTC ATAGTCACTT TTAACGACAT 
TTTGGTTTCT TAACATAAAA TGAGTTGAAG 
CATAATTCAG TGTTACTATA CATGGTACTG 

10 

AAATGACGTC TCTAACAGCA CCGCTATAGG 
TACCACCAAA ATATCTTGTT ACTACGACAC 

1S TGTCTAACAT TGGGaCACCG GcAGTTCCtG 

TATTCATTtC AGGTCCAATA GTATATGCAG 
TTTTTATTGC AGCAATAAAT GCTTTaGCTT 

20 CAATGAATCT TGATTTACTA ATCACATTTT 

TATTTTGTGT CATAATAACT CCTTAATTCA 
CACTGAAAAT GACATGACTA TAAATCGTTT 

25 GTATCATTGC TATGAGTATA TTTTAGGAGG 

TCTACAAGTT ATCTGTCGCA GGACTTAATC 
AGTGTGACTT TTGAAGATGG CAAGATTATA 

30 

GCCATTCAAA CATTAGAAAA GAAAGTATTA 
TTATTTGTCA TAAATGGAGA TCATTTCGAA 
GATGATTGTC CTTCAGCTTA TCAAGTAGCA 

35 

CATTTAGGTT CTGGTGGATT AGGTTTAGGC 
TTATAAAATT TTAATAAAAG AGTCTATATT 

40 CTTTAAATGT TCATCATTTG AAAGCCAAAA 

TTAGGCTCTT TTTTACGTTG AAATGAGGTT 
CATCCTCATA CTTCACTTAC TAATGAAAAA 

45 CAAAATTCAA ACTATTATTG TGTTCAATGT 

TATGATTCCT CAGTACATTC CAAGAAAATT 
CGAATGGATA ATGTAACAAG ATATAAAATA 

50 

TATTATCATC TCTCATTTGA ATTGTCGGAA 
CGAGCCATTA GAAAGAGACA AACGATTTTG 

55 



TTTATTCAGT TGGTATATCG AAAGGTAACT 1140 

TTCCTGCAGT CATTTGATTT AAAAAGTTAA 1200 

CGATATAGTA GCTTACCTTA TCAGTGTAAG 1260 
CTAATTCATA TTCAAATTTA CCAGTTTGAT . 1320 

CTTCTCGTAG TTCGACACGC CCGATATCAT 13 80 

CGCGAATTAA ACCGCCACCA CCTAATTTAA 1440 

ACGCATTATG aACATCGrGC TTTTTTaATA 1500 

TCGGTTCACC ATCATCATTC GCnTTTTGAA 1560 

AACAATTATG AGTGGCATCT TTATGTTCTT 1620 

CATCTTCATT TTGAACAGGT TTGATATGAG 1680 

CAATAATGTG TTCTTTTTTA ACAGTAATGA 1740 

TAAGCTTAAG ATTATTTAAT CTTCATTATA 1800 

GATTGCCATT TTCTTTTTAA CTGAAATATT 1860 

ACGACTATGA AAATTGCTGT GATGACCGAT' 1920 

GATAAATATA ATATTcAAAT AGCGCCATTA 1980 

CCAGAAGAAA AAGTTCGTAC TAAAAAGCGT 2040 

GATATTGTAA AAGACTTTGA AGAAGTAACT 2100 

GATGGTCAAG CGTTATACAA AAAGTTACAA 2160 

TACTCTGAGT TTGGTCCAGT TGTTGCAGCA 2220 

TATGTTGGCA GAAAAATAAG ATTAACATAA 2280 

GTAATTGGAA ATTATCTCTC GTATACATGG 2340 

TGCTAAAGAT ATAAGAAAAT CATTATAATA 24 00 

TTAAGCATTA AACATTACGG GAAATTAATT 2460 

ATTAAAAAAG AAGTAACAGG TGTCATCAAA 2520 

GAAAGTACAA ATCCAAAGCA TTTTTATCAG 2580 

GTATATTGCA GAAATTGTAT ATCACTGGGT 2640 

ACAGAGAGTT CGCAAAGTTC ATCACAAGCA 2700 

CAGCAGTCTT ATGCCTCAGA ACATATTGTT 2760 

TTATATGCCG TAACAGGTGC AGGTAAGACA 2820 
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TCACCACGTG TAGATGTTGT TGTAGAAATT AGTAAACGTA 
GAAGATATAG ACATACTACA CCAGCAATCA AGACAACAAT 
5 TGCACAGTGC ATCAACTTTA CCGATTCAAA CAGCACTTTG 

GTCGATGCCT TTCCTTTATC AATGGATAAA AATTTACAAC 
AAAGTTGAAC ATGCAACAAT TTATATGACA GCAACACCAC 

10 

ATTCCCCACG AAAATATAAT TAAATTGCCA GCTCGCTTTC 
CCTAAATATC GTTATTTCAA ACTTAATAAT AAGAAGATTC 
TTACAAGATC AAATTAATAA TCAACGTTAT ACACTGGTGT 

15 

ATGATTAAAA CATTTTCGGT TTATAAGCAG AAAATTACTA 
GAGGATGTTT TTCGCTTTGA AAAAGTTGAA CAATTAAGGA 
20 TTTACTACGA CAATATTAGA ACGTGGATTT ACAATGGCAA 
GATGCACATC AATATACTCA AGAGGCTTTA ATACAAATTG 
(2) INFORMATION FOR SEQ ID NO: 266: 

25 . (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1017 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

30 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 266: 
TTTCCAAGAA GGcTTgAAAA AtGTTwCaAG TGGTGCGAmC CCAGTTGGTT TACGACAAGG 60 

35 

TATCGACAAA GCAGTTAAAG TTGCTGTTGA AGCGTTACAT GAAAATTCTC AAAAAGTTGA 120 
AAATAAAAAT GAAATTGCGC AAGTAGGTGC GATTTCAGCA GCAGATGAAG AAATTGGACG 180 

40 TTATATTTCT GAAGCTATGG AAAAAGTAGG TAACGATGGT GTCATTACAA TTGAAGAATC 240 
AAATGGACTA AACACTGAAC TAGAAGTGGT TGAAGGTATG CAATTTGATC GTGGTTATCA 300 
ATCACCGTAT ATGGTTACTG ATTCAGATAA AATGGTTGCT GAATTAGAAC GCCCATACAT 360 

45 TTTAGTAACA GATAAGAAAA TCTCGTCTTT CCAAGATATC TTACCTTTAT TAGAACAAGT 420 
GGTTCAATCT AATCGTCCAA TCTTAATTGT AGCTGATGAA GTTGAAGGCG ATGCATTAAC 480 

AAATATCGTG CTAAACCGTA TGCGTGGCAC ATTTACAGCT GTTGCAGTAA AAGCACCTGG 540 

50 

TTTTGGTGAT CGTAGAAAAG CGATGCTTGA AGATTTAGCT ATTTTAACTG GTGCGCAAGT 600 

GATTACTGAT GATTTAGGCT- TAGATTTAAA AGATGCATCA ATTGATATGT TAGGTACTGC 660 

55 



TTAAAGACGC ATTTCTTAAT 2940 

TTGAAGGGCA TTTTGTTGTA 3000 

ATACTATTTT TATTGATGAA 3060 

AAGCATTGAA GTCATCTTCT 3120 

CGAAACAACT TCTGTCAGAG 3180 

ATAAAAAATC ACTTCCAGTT 3240 

AGAAAATGTT ATACCGAATT 3300 

TTTTTAACAA TATAGAAACA 3360 

AATTAACATA CGTCCATAGC 3420 

ATGGACATTT CGATGTCATT 34 80 

ATTTGGATGT TGTTGTTATC 3540 

CTGGACGTG 3589 
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CAGCATTGAT GCACGTGTTA GCCAATTGAA ATCTCAAATT GAAGAAACTG 



AATCTGACTT 



780 



TGATCGTGAA AAATTACAAG AGCGCTTAGC TAAATTAGCA GGTGGTGTTG 



CAGTTATCAA 



840 



AgTAgGTGCA GCAAGTGAAA CAGAGCTTAA AGAACGTAAA TTACGTATTG 



AAGATGCATT 



900 



AAATTCTACA CGTGCAGCAG TTGAAGAAGG TATTGTTGCA GGTGGTGGTA 



CTGCATTAGT 



960 



AAATGTTTAC CAAAAAGTAA GTGAAATTGA AGCTGAAGGT GACATTGAAA 



CAGGTGT 



1017 



10 



15 



20 



25 



30 



35 



40 



45 



SO 



(2) INFORMATION FOR SEQ ID NO: 267: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1409 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 267: 

TTAATCCAGC GTTAACTGTA TTTGCATTTA TTATGATTAT TTCGATTCTT TTAGCGTATG 60 

TATTTAAATG GCTTGGATTA GTGGATGATG TGTTATTAAT GGTCATTATC ATTTCAACTA 120 

TTTCCTTAGG CGTAGTTGTT CCAACTTTAA AAGAAATGAA TATTATGAGA ACAACTATAG 180 

GGCAATTTAT CCTATTAGTA GCAGTACTTG CGGACTTAGT AACTATGATT TTATTAACGG 240 

TCTATGGCGC AATCAATGGT CAAGGCGGCA GTACAATATG GTTAATAGGT ATATTAGTTG 300 

TTTTCACAGC AATTTCATAT ATTTTAGGTG TTCAATTTAA AAGAATGTCA TTTTTACAAA 360 

AATTGATGGA TGGTACGACG CAAATCGGTA TTCGTGCGGT ATTTGCATTA ATAATATTAT 420 

TAGTAGCCCT AGCAGAGGGA GTTGGCGCAG AAAATATATT AGGTGCATTC TTAGCAGGTG 4 80 

TCGTTGTTTC ATTATTAAAT CCAGATGAAG AAATGGTTGA AAAGTTAGAC TCATTTGGTT 540 

ATGGGTTCTT TATTCCTATT TTCTTTATAA TGGnTGGTGT AGATTTAAAC ATACCTTCAT 600 

TAATTAAAGA ACCGAAATTA CTAATTATCA TACCGATTTT AATCGTnGCA TTTATCATTT 660 

CAAAATTAAT TCCAGTCATG TTTATTCGAC GTTGGTTTGA TATGAAAACA ACGATTGCAT 720 

CAGCATTTTT ATTAACATCA ACATTATCGC TCGTGATAGC TGCAGCCAAA ATTTCAGAAA 780 

GATTAAATGC TATTTCAGCT GAAACGTCAG GTATATTAAT TTTAAGCGCA GTCATTACAT 840 

GTGTATTCGT TCCGATTATT TTCAAAAAAC TGTTTCCAGT TCCAGATGAG TTTAACCGTA 900 

AAATTGAAGT TAGTTTAATT GGTAAAAATC AATTAACGAT TCCTATAGCG CAAAATTTAA 960 

CATCTCAGTT ATATGACGTG ACATTATATT ATCGCAAAGA CTTGAGTGAT CGTCGTCAAT 1020 

TGTCAGATGA TATCACGATG ATAGAAATTG CTGATTATGA ACAAGATGTT TTAGAACGAC 1080 
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AAGTTGCTAA ATTAGCCAAA GCACATCAAG TTGAGCGTGT CATTTGCAGA CTTGAAAGCA 



1200 



CAACGGACGA TACAGAGTTA GTTGATTCAG GTATTGAAAT TTTCAGTAGC TACTTAAGTA 



1260 



ATAAAATCTT ATTAAAAGGT TTAATTGAAA CACCTAACAT GTTGAATTTA TTAAGTAATG 



1320 



TTGAAACGTC ACTATATGAA ATTCAAATGT TAAATTATAA ATATGAAAAT ATTCAATTAC 



1380 



GTAATTTCCC ATTCGGAGGA GACATCATC 



1409 



10 



15 



20 



25 



30 



35 



40 



45 



50 



(2) INFORMATION FOR SEQ ID NO: 268: 

C ± > SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4702 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 268: 

AAAGAGGGTT TTTTACTACT ATAATCCATC CTTTAATGGA ATTCCATTTG TCCCTTTGGC 60 

CCGTTCATAA CCATAGGAAA ATATATGCnG nAATCATTGA TAGTAAATAC ATCAATAATA 120 

CGAATAATGT CGGTGAAATC ACGTCCGTAT TACCATTATT AGCTAAAACA TTTTCCAAGT 180 

TTTCTTTTGA ACCGGATACT CATAAATGCT TTTAATGCnT GGTTTTGTCT GTCGCCATCT 240 

TTAGAATTTG TAATACTTTT TTAAATTCTT TAGCGAACAA CTCATTATCT TTATCGTTTT 3 00 

TAGCCATTTG ACGATTCAAA TCGTTAGCTC TTACGCCTAA TGCTCGACCT GTCGCATGTA 360 

GCTTATTCAC ATTATTGTCG ACTTGATTTA ATTGGCCACT AACAGAATCT GCAATTGATT 420 

TTGATTCTTG TGTATCTGAT AGCAATTGCG TACTCTTTTC AGAAATTCTA CTAATTTCTT 4 80 

TATCTAAATT TGAAGACATC GTATTAAATT CATCATTTTT GCCTTTATCA ATTTTTGGTT 540 

CTTGTGGCTC TTCAGCAAAA GTCTTTTTAA CGTTTTCTAA CTGATCAATC AGCTTGGAAA 600 

TATCTTCTTlc ATTTTTTGTT gTATTCTTTT TGTTATTTAA AATGTCATCA ATCAGTTTGT 660 

CTGAGTTTTC TTCCATTGAA TCAATTTGaT GTAACACAGC TACTTTATCG TCTTTGAAAC 720 

TTTCCATGTC ATTGATAACT TGGTCAACCA TCATATCAAT TAAACGTTTG TTGTCGAATG 780 

GTTTATCTTC tCTGCCTTTT GTATCTGTGT ACATTTTATA ATGCGCATCA AACCTAGATA 840 

ATGCACTCAA TTGCTGGCTT AATGCATCTT TCGATAAGCG ACCATCaAGG TTATGATTCA 900 

ATGTTACATC CACAACACTC GTTGCTTTCT TATCATTTGG TTCATCTTGA CGATTTGCTT 960 

GTCCAAATAA CAATTGTAAA TGCATTGTTT TATCTTTTAA GAAATCTTTC TCAGCATCCT 1020 

TTTTCAATTT AGCAACGCCA TTGACTTCAA CTTTATATTC CTTGTTAGAT GTATCGAGTT 1080 
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TAAAATGAGG AtCTGTTGCA ACAGTTAATT GATTAATATC ATTACTTTTA ATCGTTTCAG 1200 

TACGTTGCAC TTTGACACCA TCATTAATCA AACTACTTGT GTCTTGCGCA ACTTGGTTAT 1260 

CGTAATCTGT TAAATTAATG TGTTCTGCTA ACGGTTTTTT CAAATTATAT TCATTTTTAT 1320 

AACGTTTTGC TTCTTTGACA ATTGCTTCGT ATTTATTAGC TTCATCCTCA TTTAAACCTG 1380 

CAGCTATAAA GTCTTGTTTA GACATGTTAT AGATAAATGT TGTATCTGTA TCAGGTTCTT 144 0 

TGACAATATC ATCATGAAGT TGTTTCTCTA AGTTTTCAGC GAATTGAGCA TTGTTCATTT 1500 

TAATGCTATT TAGCGCATCT TGTAAGTCTT TGTTATTTGC AAGCTCATCT TGCAGTGATT 1560 

CTGTTAATTG CTTACGATAn TCTTCAATCA TACCTTTTGA AAATGGTGAC TCTTGTGATT 1620 

GAATGATTTC TCTTAATTTA TCTAAGTTTT CTTTAACAGT TTGTTTATAT TCTTCTTTAC 1680 

CTGTATCTTG CATACTTGAT TGTTGATCAA TTTGGCTGTC CATCTGTTTT AATGCATTGA 1740 

20 TATAGTTATC AAGTTCCACG CTATCTTTTT GCGATTTATA ATCTTGTAAC ATTTTATCCA 1800 

TCGCTGTATT GTGCTCGTCA AATAATGAAT TTTGTTTTTC AATTAAAGTC GAAACATTAT 1860 

AATCTGTGTT CACTCTGAAC GTATCTGAAT TCGCACTCAA TAATGATTTA TTGTATGTTT 1920 

25 GGAACCATTT TGTAATGTCT TTGTTTGCAG AAATTGAATT TACAAGCGTA TCTGTAAATA 1980 

ATTC CGGGAA GTCGTTAATT GGATTTAATA AGTAATTCGA GAATTTACTA TTCACACCAT 204 0 

GTTCACGCGT CATAATAGCG CCAACATTTT TTTGTGCATT ATGTAAATTA TCAATGATGC 2100 

TTGTTAAATA AATTTCGACT AAGTTTTTGT TAAAGTCGTT AAGTACATTA CTTACAACTT 2160 

TTTCTGTGTT TTTAGCTACT TCTTCTTTTT GTCCTACAGC TGTTTTATAC TGTAGCGATA 2220 

TTTTCGATGG TGTTTTAGCG TCTAATTGCA TTGCCAATTT TGAAAAGTTT TCTGGGATAA 2280 

CAATCATGAC TTGGTATCCA CCATTTTTCA AACCAGACTC AGCAACGTTT CTTGTTACTG 2340 

TTTCAAATTT ATAGTTTTTC TCATTTGCTA ACCTTTTAAT AAATGCTTGA CCCAGCTCAA 2400 

CTTTTTTACC GTTATATGTC GTTGGTTGAT CCTCGTTAAC AATTGCGATA TGTATTTTAT 24 60 

TATTTTTATT ACTTACACTT TGGGATCCTT TTTCTGATTG ATCTCCATAT TTTGTTTGAA 2520 

CAAAAAATAT CATACTAACT ATGGCAATTA TAATAATTAA AGTGACAATT AATGCATAAA 2580 

45 TCCAATTTTT CTTTTTCATG CTTATTTCCT TTCAGTTGTT TTCTTAAAAA AATGATAAGC 2640 

AAAGCCACAT TAGAAAATGT GACTTTGCCA ATTTCAGAAT GCTTATTGCA AACCGAAATT 2700 

ATTAGAAAGT TGTTGGTCTT GTTCTTGAAC GGCATCAGCA GTGCtATTcA ATTGTTGTTT 2760 

SO 

AATTTCTTCT AATAATTGTG CAAATTTTTC TACTTTAGGA CTAAGTTGTT GGAATTGCTC 2820 

TTCGAAACGG CTGAAAGCTT GACCTTCCCA GTTCGCTGCA ATTTCACCTt GTGCACGkGT 2880 
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TCTGATTTCC TCTGGACTCA TCTTAATCAT 
AAGTTTATCa AAACTTTTTA GGGACACTAT 
5 TATATAAATT ATTAGTATAT GTATATAGTt 
ATATATTGAA TATAACCATA TATTTTTAAT 
ATACTAAAAT TAAATTAAAT ACATAAAGGA 

10 

ACTGACGATG ACAACTCTTA CTTTATTTAG 
GAATGATAGC AAAACATTAG AAGAAGCAAA 
GAATAAAGAC ACCGGCGCGT ATACTTATAC 

15 

TCATCAAAAC CAGTCACGTA CAAACGACAA 
CAACAATCAG TACCATTCTT CATTAAGTGG 

20 TTCACACACA CCGCCTCAAA CGTCACCAAG 
CGAAGACAAT GACGATGAAT TAAATAACGC 
AGGCATCGAT TTAGACGAAT TGTATGACGA 

25 AAAGACCGCT GACGGTAAAC CTTTAGCATT 
TATCACAAGT AAGAACAACT TATATACTGC 
ACGTGCCAAA GATGGACACA CGATTAGTAC 

30 

CCAAGCTTCA AGCAATGGCT TCAAAGTAGA 
AACAGTAAAT GGTCCATTTG GTCATGTAGC 
TATTCTAATT TCAGAAATGA ACTGGATTGG 

35 

TGCTTCAGAA GTTTCATCAT ATAATTACAT 
GCGACCAGTT CGCAGTTTAC AATTCGTAAC 
TTATTCGATT ATAAAATTAC AAAGAAATGT 

40 

TACGAAAGTA TAATTGTAGC TATAATAATC 
TTGAATAAGA ATATACCGTA TTTTTTCTTG 
45 ATGATTATAA CACCAACAAA AATAAATACA 
TCAGGTTGCA TTCTTAATTT AGTGATAATT 

ATACCTCTTA TCTTTGATGT CTGTAAATCT 

50 

TCACCCAATT CTTTTGCAAT CAAATAATTT 

ATTGCAAAGT ACATAAAAAT ATATGATCCA 

55 



TGCCATAACT AGAAACCTCC TGAATATTTT 3000 

TTTTTGAAAA AGTGCTCCTT ACTCAAATAA 3060 

TTTTAAGTAT TTTTAGCTTT TTTAAAATAA 3120 

TAACCATTCA TTTTTGTAAT ATAAATGTGT 3180 

TTAAATGGTT ATTATGAAGA AAACAATTTT 3240 

TATGTCGCCT AACTCGGCTC AAGCATATAC 3300 

GAAAGCACAC CCAAACGCAC AGTTCAAAGT 3360 

ATATGACAAA AACAACACGC CAAACAACAA 3420 

TCATCAACAC GCAAATCAAC GTGATCTTAA 3480 

TCAGTATACG CACATTAATG ACGCAATTGA 354 0 

CAATCCTTTG ACACCAGCAA TACCGAATGT 3600 

TTTTTCAAAA GATAACAAAG GGCTTATTAC 3660 

ATTACAAATC GCCGAATTTA ATGACAAAGC 3720 

AGGTAACGGT AAAATCATTG ATCAGCCTCT 3780 

TGGACAATGT ACATGGTATG TCTTTGATAA 384 0 

ATTTTGGGGA GATGCTAAAA ACTGGGCAGG 3900 

TAGACACCCA ACACGAGGAT CAATTTTACA 3960 

CTACGTTGrA AAAGTTAATA TTGATGGAAG 4020 

TGAATATATC GTTTCATCAA GAACCATCTC 4080 

CCATTAAATT AATCATGACA TCAATAAAAA 4140 

ACTGCAAAAT TGGTCGCTTT ATTTTGTATG 4200 

TCTCTACATT CCCCATTAAT CAAAATCGTT 4 260 

CAAGTCGTAA CAACTAGTGG CACTATCGTC 4320 

CGATATATAT CCAGTACTAG CCAAATTAAA 4380 

GGATTCATCG ATATAGCATC TGCCTGTAAC 444 0 

AACATCACTA CTGAAATAAT GAAAAAGTAG 4500 

AATTCCTGCT CTTCAATGAC CTCTTTAGAT 4560 

ACTACCTTAG GTTTCACCCA TAAACACTTA 4620 

GTATCCATAA ACATTAAAAA GTTGCTTAAA 4680 
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(2) INFORMATION FOR SEQ ID NO: 269: 

(i) SEQUENCE CHARACTERISTICS: 
5 (A) LENGTH: 2004 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

10 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 269: 

ACAAAAAATT CACCCTCATT AATATTGAAA CTAATGTTAT CGACAGCAAC ATGTTTGCCA 60 

15 TAACGCTTAG TTACATTTTT AAACTTAATC ACTTTGCCAC CTCTTTTTTT CTCATAGCAT 120 

AAAACCGAGA TTATATGTAT GTATTCCCTA TTTAACCACG TTTATTACAA TTTTCAAATT 180 

TAAATGATTT ATCCTTGAAC TTTTTTAATA AAATAATGAA TAAwAGGwAA TCwCCAGTTA 240 

20 AGAAATAGTG TTATTTTACC TTGAATTCAA AAAAACACCC AGTAAAACAA GGAATGCTTA 300 

CTAGGTGTCT TCACTATACT TTGGCTTTAT AATTTTGAAT CGTTtCTAAA AATGCTGGAC 360 

AATAATGTTT TAATTTGTAA CTACCTACGC CATCmATATT AATCATATCT TGTTTCGAAG 420 

CAGGCTTACG TTTAGCAAAT TCCTCCAACG TGTAATCAGA AAATATACTT ACAGGTGCTA 480 

TCGTTAATTT GTCACTTAAC TTTTTACGAA CTTCTACCAA CTGACTGAAT AATACTCGGT 540 

CAACCCCTTC AACCGTATTT ATAAATACTT TTTCAGTCGC TTTTTGCTTA AATGGTGTTG 600 

TGAATACTTC TACTTCATTA CTGAGTAATT TTTTAATTGA AGTATCACAC ATTAATATTT 660 

CGTCATTTTC ATTTAAGAAC CCTTTGAATC TTAATTCATC TATTAAGTGA CTTAATTCTG 720 

ATGTTGTGTA ACCTTTCATT AAACCATGGG TTGAAATTTG GTCATAACCT TTATACTTAA 780 

TATAATCTGk TGACTCTCCT CTTAACACTT GAATGATAAC ACTATAACTC TCTTGTTGTT 840 

TCATACGAGC GATGCAACTA ATAATCATCT TAGCTTCTTG TGTCATATTA TATGATTTAT 900 

40 CTTGTTGAAC ACAATTACTA CATTGTTCAC ATTCTTCTAA TTTTTCATTC GGTTCAAAAT 960 

AATGGACAAT TGTTGCTTCT AGACATTTTT TTGTTTTTGT ATATTGAATC ATTTTAGTTA 1020 

ACTTTTCGCC CATTTTATCT TTATAGTCAT CATCAGCTTG AGAGACTGTT ATAAAATACT 1080 

CGTGTAAATT GATAtCGCGT TCGCTAAATA ACAAAATACA TTCACTTTTC AACCCGTCAC 1140 

GACCTGCACG ACCCGCTTCT TGATAATAAG ATTCTAAATC TCCAGGCATA TTATAATGAA 1200 

TAACAAAGCG TACATTGGAT TTATCAATAC CCATACCAAA AGCATTTGTA GCAACGACTA 1260 

CTTTAACACG ATCAAATAAG AAATCATTCT GCGCTTCTTC TCTTTCTTTA TTGCTCAAAC 1320 

CTGCATGATA TATAACACTT TCAATTTTCT GACTTTCTAA GGCTTCTTGA AGCTCTTCAA 1380 
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CCAATATAAA TTTTTGACGT TGATAAGTAG GATTTACTTT AAAAATTAAG TTTCTACGCT 1500 

TAGTACTCGT TTTAATTTGA TCAGTTTGAG CGATATTTAA CTTTTCTCTA ATATCTTGCT 1560 

5 GTACTTCAAC CGTGGCAGTT GCTGTCAACG CTATTATTGT AAAATCTTGA GGTAACGTAA 1620 

ATACTTTTGA AATAACATTT TGGTAACTCG GCCTGAAATC ATGACCCCAT TTAGAAATAC 1680 

AATGCGCTTC ATCAAACGCG ACTAAGTGAA TCTTTATACG CTGAAGCATA TTTAAAAAAT 174 0 

JO 

ATCGGTTTTC AAATCGTTCT GGTGCAACAT ACAAAAATTG AATTTCTCCA TTTGATAATG 1800 

CTTTTTCAAT ACGTTGTTGC TCTTTTTGAG TCAAACTACT ATTTAAAAAA GCAGCTTGAA 1860 

^ TTCCCATCGC TTTTAATTGA TCCACTTGAT CTTTCATTAA TGATATTAGT GGACTTATTA 1920 

CAATTGTTGT ACCACCTAAC mATAAACCTG GTACTTGrTA GCmTATAGAC yTACCTCCAC 1980 

CAGTtGGkAA GrCACCAAGC ACAT 2004 

20 (2) INFORMATION FOR SEQ ID NO: 270: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2244 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
25 (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 270: 

30 

AAAGATTGCT TGCCTTGAGG GTTTATATAT CTGACTCAAT TGCCACATTT TTATCAAGAG 60 

TAGTTGATAA TACTCATCAT AATTATAGCT AATATTATAT TTTTTTAAAA GATAGTGTAT 120 

GATTTTCTGG TGTTTGTTGT ATACGTCATT AAATTTCAAG TAGTCATTCT CCAAGTTATA 180 

35 

CGTATAACAA ATATTTCCGG ATAAAGTTAG AATAAAATAT TTAGAAAAAT CATTCATTTG 240 

CGTAATCGCT AAATTAAGTG TTAAATATAA GACATAAGTA ATTAATTTAA TGTGATATGA 3 00 

4Q TGTATTATTA CTTTGCTAAA TAGTAGATAG AACAAAATTT GTAATCGGGA GGTAACAATG 3 60 

GATTACGCAC ATTTAAATTT AGAACATTTT TTTGCACGAA ACGACGATTT AGATGTTATA 420 

AGAGATCGCG CTGATTTCGT GATGATAAAT AACTTCACTA ATGAAATGAT GTATCGTGAT 4 80 

45 GGTCAAATTG AAGGCACGAT TGATTTAAAT CAGTACTATT ATAAAAATAG ATCAAATGCA 54 0 

GCAAGTTTTA TTATGATGGA TTATAAAAAA GAAACTAAGT AAACGAACAA AAGAATTTTT 600 

TGTTTTTTAA TACGTGAATA ATAAGATTAT TGATATAAAG GTTTTCAAAG GTTATACAAA 660 

50 

AAGATAAAAC ATTTATGATT CGTAGATCAA CGTAAAGTAA TGTTGATAAA TGGTTTAAAA 720 

CGTTTCATTT ACATTACTGT TTATTTATGA ATATGTAACA ATGCATAGAT AAAATTGTTA 780 

55 
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ACCTAAGAGG TGTGGATATG AATAAACACA AGAAAGGTTC TATTTTTGGA ATAATAGGAC 900 

TTGTTGTCAT ATTTGCTGTT GTCyCaTTTT TATTTTTCTC AATGATATCC GATCAGATAT 960 

TTTTCAAACA TGTTAAATCC GACATTAAGA TTGAAAAGTT AAATGTTACA TTAAACGATG 1020 

CAGCAAAGAA ACAAATAAAT AATTATACGA GTCAACAGGT ATCAAATAAA AAGAATGATG 1080 

CATGGAGAGA TGCATCTGCA ACTGAAATTA AAAGTGCAAT GGATAGCGGT ACTTTTATCG 1140 

ATAATGAAAA GCAAAAATAT CAATTTTTAG ATTTATCAAA GTATCAAGGG ATTGATAAAA 1200 

ATAGAATTAA ACGTATGTTA GTAGATAGAC CAACGTTATT GAAACATACG GATGATTTCT 1260 

TAAAAGCTGC TAAAGATAAG CACGTTAACG AAGTTTATTT AATTTCACAT GCATTATTAG 1320 

AAACTGGCGC AGTTAAAAGT GAATTAGCTA ATGGAGTCGA AATTGATGGC AAAAAGTACT 1380 

ACAATTTCTA TGGAGTAGGA GCCCTTGATA AAGACCCAAT TAAAACAGGT GCAGAATATG 144 0 

CTAAAAAGCA TGGTTGGGAT ACACCTGAAA AAGCTATTTC AGGCGGTGCT GATTTCATTC 1500 

ATAAGCACTT CTTATCAAGC ACAGATCAAA ATACATTGTA TAGTATGAGA TGGAATCCAA 1560 

AAAAT CCAGG AGAACATCAA TATGCTACAG ATATTAAGTG GGCAGAAAGT AATGCAACAA 1620 

25 TTATCGCTGA CTTTTATAAG AACATGAAGA CTGAAGGAAA ATACTTCAAA TACTTTGTGT 1680 

ATAAAGATGA CAGTAAACAT TTGAATAAGT AATTTGATAA GCTACGAGTT GTTTTTATGA 174 0 

CTCGG ACATA CTAAAAAGAC GCTTTCTATC TTGTTTTGAT AGAAAGCGTC TTTTTGCATT 1800 

AGAGAAAACA CATTGATkGA TAAtCCCaCC aATGCAAgTG GGGcAGGACa TCGATAAAGA 1860 

ATTACTT TT T CTTTAGAAAT TAGTATTTCT TATGCATGAG TTTTACTCAT GTATTCCTAT 1920 

TTTTAAGTAC ACATTAGTTA TAGCTAATGA TAAAGAACCA CTACATAATA AATCATTAGT 1980 

GTTTTTTTAT CATTTCTGTC CCaCTCTCAT CGTGATTTGA AATTTTCAAT TGCGATTTTA 2040 

ATTTCATCTC TTACACGTTG GAACTCTGAC CAAGGCTTGC CTGCAGGATC ATCAAATCCC 2100 

CAATGTTCTT TCTTAACATT TGTTGGTAAA GAAGGGCAAT TTACGTCTGC ATCACTACAT 2160 

AATGTAACAA CTAAATTTGA ATTTnTAATA ATATTATTAT CGGATTAAAA TCTGATGGAT 2.220 

GATTTGATAT ATCAATGCCT ACTT 2244 

45 (2) INFORMATION FOR SEQ ID NO: 271: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1371 base pairs 
{B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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ATAAGCAATT TAATTTTGAG TCTACAATGG AGGAATTATC ATCTTTATCA GAGACTTGCC 60 

AACTTGAAGT GTTGGGTCAA ATTACTCAAA ACAGAGATCG TGTAGATCGC AAATATTATG 120 

TTGGTAAAGG TAAAATTGAA GAAATTCAAG CATTTATTGA GTTCAAAGAT ATTGATGTAG 180 

TCATCACAAA TGATGAATTA ACGACTGCAC AATCCAAATC ACTAAATGAA GCTTTAGGTG 240 

TAAAAATTAT TGATAGAACT CAGTTGATTC TTGAAATATT TGCATTAAGA GCAAGAAGTA 300 

AAGAAGGTAA ATTGCAAGTA GAGCTAGCAC AACTTGATTA TTTATTACCT AGATTGCAAG 360 

GCCATGGTAA AAGCCTTTCT CGTTTAGGTG GCGGTATTGG AACTAGAGGC CCTGGTGAAA 420 

CGAAGTTAGA GATGGATCGC AGACATATTC GAACTCGTAT GAATGAAATT AAACATCAAT 4 80 

TGCGGACGGT AGAAGAACAT CGCGAAAGAT ATCGAAATAA AAGAAATCAA AATCAGGTGT 540 

TTCAAGTAGC TTTAGTTGGT TATACAAATG CTGGTAAATC ATCATGGTTT AATGTTTTAG 600 

20 CAAATGAAGA GACGTATGAA AAAGATCAAT TATTTGCAAC GTTAGATCCT AAAACACGAC 660 

AAATTCAAAT AAATGATGGA TTTAATTTAA TTATTTCAGA TACTGTTGGT TTTATACAGA 720 

AACTACCTAC GACGTTAATT GCAGCTTTTA AATCAACTTT AGAAGAGGCT AAAGGTGCAG 780 

25 ATTTATTAGT ACATGTCGTA GATAGTAGCC ATCCTGAATA CCGTACGCAG TATGACACAG 840 

TTAATGATTT AATCAAACAA TTAGATATGA GTCATATTTC TCAAATAGTT ATTTTTAATA 900 

AAAAGGACTT ATGTGATCAT GCATCAAATC GTCCAGCAAG TGATTTGCCT AATGTTTTTG 960 

TTTCTTCTAA AAATGATGGT GATAAATTAC TTGTTAAGAC GTTATTTATT GATGAAATCA 1020 

AAAGGCAATT AACTTATTAT GATGAGACAA TTGCGACGAA TAATGCAGAT CGATTATATT 1080 

TTCTAAAACA ACATACATTA GTGACTGAAC TTAAATATGA TGAAATTGAA AATGTTTATC 1140 

GTATAAAAGG ATTTAAAAAA TAATAAAAGG ACGAAATTCA AATGAAAGAT ATAAGTAAGA 1200 

TAGTAGCTGA CGTCGAATCA ACGTTAGCAC CATATTTTAA AGAAATTGAA GAAACAGCAT 1260 

40 ATATTAATCA AGAAAAAGTA TTAAATGCAT TTCATCATGT CAAAGCAACC GAAAGTGATC 1320 

TACAAGGATC AACAGGATAC GGGTATGATG ACTTTGGACG TGATCATTTA G 1371 
(2) INFORMATION FOR SEQ ID NO: 272: 

45 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6035 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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CGTAAAcCTA TGCGTTTTAA 


TAi 1 CTGAAt* i 1 At. 1 lAu 1 1 


CATCCTCAGT 


TTCATCCATT 


120 




TGTTTAATAT AAATAATACA 


rp » /*i /"trr*/^ rvn » f**T* R a 7\ A ft 

TCCAGCTCjt-I ALlAflniiAlu 


CTAATCCTAA AAATGATGTA 


180 




ACAAATATTA GAATACCGTT 


AblAuUAlCb ALtlLl 1 111 


TCATTTCATC 


ATACGTGATG 


240 




ACTTTGTCTC CAAACTGTTT 


TGCAATTGCT TUAijt- 1111 A 


CCTTTTGTGA 


TGTTTGTTTA 


300 




ATATCATATC CATAAAAAGT 


ATGAAUvj 1 1 A 111 1\j 1 vj 111 


TCAACTGCTG 


ATACTTTTCA 


360 


10 


GGACTTACTT CGATGACAGG 


TGAGTTGAAG CTTAGATTTA 


AAGGATAAAC 


CTTACCTTTG 


420 




TCTTCTTGTG TAcACGGAAA 


GTTTCATTCT TAGTACCTTT 


TACTACTAAA TCTTTGTTTA 


480 


15 


AATGGATATT AATAATGTTA 


GGCAGCGATT TTGTATTTGT 


AATGATGGCA 


TTGTTGCCTG 


540 


TtAACTTGTT ATTTGCACTT 


AAAATAGAAT TCGTGCGACC 


TGAATCACTA 


CCATTTTCCA 


600 




AAGTAATAAC CTGATCATTA ACATTATCTA CAGTAATAGT 


TTCGTAAGCA 


TTTTTAGAAA 


660 


20 


ATGTAATTTG TTGTTGGCTT 


AGTTTAGTTT CAAATTGTTT AGCATCTTGA 


GTAGCGACCA 


720 




CGTTAAATTC ATTTGGTGCC 


ATAGATGTAA GGGTTTGATC 


TGTATTTGAT 


TTAGATAATG 


780 




CCGCAAAACA CAATACAGTT ACTGTAACTG CAGAAATAAT 


TGCAATGATA 


GTTAAAGACA 


840 


25 


TGGCATTTTT CTTCATTCTG 


TACATAATAG ACGATGTGAA 


TACAACATCG 


GTAATAGATA 


900 




CGCGTCCATT TTTTGATTTT 


TTCAATGTTT TAAAAATAAG 


TGACACGGAA 


CTTCTGAAGA 


960 




ATAAATAGGC GCCTACAACC 


GTTAAAAATA AAATGATAAA 


CGGTGATGTC 


ATAGCCATAG 


1020 


30 


TTAGTGCTTT GAACGTACCA 


AACATTTCTG TCGCCATATA ATAGCCTAGT GCAATCATAG 


1080 




CAATACCTAA TACGCCTGAA 


ATAACCTCTG CAGTCGTTAC 


TTTAGCAGTT 


GTGGCATCAG 


1140 


35 


TTTTAATTGA ATCTTTCATC 


ATTGATAAGA TACTACGTCT 


TTTTAGAAAT 


AAAGCACTTT 


1200 


GAAATAAAAT CAGTACATAC GCAATAATTA GCATGAAAAT 


AGTTAAAACA 


AGGGCCATAG 


1260 




GTTCGAAATG TATCGATAAG 


TTAATCGATA ACGACATCAA TTTAGATACT ATGGAAAGCA 


1320 


40 


ATAaTTGTGC ACCTGCAATG 


CCACATAATA CACCGACAAC 


ACCTGTGATT 


AAAAATACGA 


1380 




TCATTtGTTC AAGTGCTAAC ATTTnCAAAA TGTTTTGTCG 


TGTTAAACCA ATCaACTGAA 


1440 




ATAGCGCAAA TTCACGTGTA 


CGGCGTTTTA CGrmTAAATG 


ATTGGCATAC 


ATTAAAAAGA 


1500 


45 


TGACAATAAT GATAAATAAA AATATTGATC CGACTAAAGC 


ACCTTTCTTA ATGATGGCCA 


1560 




TCGAGTCGTC ATTATTTACA CCTTTAGTAA ACTGTAAGGT 


TGTAAAACTG 


AAATATAAGA 


1620 




CGATGCTAAA AAATAATGAA AATAAATACA TTGCATAATG 


TTTTAAGTTT 


TGTCGTAAGT 


1680 


SO 


TTTTGAAAAC GATATGGTTA AATGTCATTT GAGACACCAC 


CTAATACTGA 


TTGAAGATGT 


1740 




ACAATGTCTT CATAAAAGGC 


! CTGTTTAGAA CGTCCTTCCT 


GATAAAGTTG 


TGTATGAATT 


1800 
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ACCATGACAA TAGTTGTATC AAACGATTTA TTCATTTCTT CCAAACGTTG TAATAGGTCA 1920 

TTTGCACTTT TCGAGTCGAG TGCGCCTGTT GGCTCATCTG CAAATATGAT TTGTGGTTTG 1980 

5 TGAACAAATG CTCTCGGTGC TGCAGTTCTT TGTTGTTGAC CACCAGATAA TTCGCTAGGG 204 0 

TATTTATTTC CTAGGTCATA AATACCTAAT GCTGTCGTGA TCGCTTTATA ATTTTCTTCC 2100 

ATTGTTGCCT TCGACATTTT TTGAACAGAT AAAGGTAACA TAATGTTTTC TTTAACGGTT 2160 

JO 

AATGTCGGCA GAATACTGTA ATCTTGGAAG ATGAAACCTA ATGATTCTTT GCGGAATTTG 2220 

GCAAGTGCTT TTTGATTAAG TTTATTAAGC TCTTGTCCGT TAGCAATCcg CTACCGCTAG 2280 

AAATTTGGTC AATTGAACTT AGTACATTTA ATAAGGTTGT CTTACCTGAT CCAGAAGGCC 2340 

15 

CCATAATCGC AACGAATTCG CCTTTTTGTA TGTCAAAGTT AATATCTTTA AGTGCTTGAA 2400 

ATGTGTGCTT TTTACCGTAT GTTTTTGAAA CATGTgCACT GATAATATCG TCATAGTCTC 2460 

20 ACTCCTTtTG TATTTAATTT CATTTTAAAT AATGTTTGGA GTAGTAGCCT TTATCTAAAC 2520 

TTACAATTCA ATGAATGAAC CTTACAGAGT TGAAArcTAT CGCTACTTAG TAGATTTTTG 2580 

AGTGAGGATA CAGATTCATC GTACATATTA GACAAAAGCA ATGGTGCTTT CTAAGTGATG 2640 

25 ATGTTTGTGT AAATTGAGAA AAGGGAATTT AATTATTGTA TAATAAATTT TTTGTAAAAA 2700 

TTAAAAGAGG GTTTTATTTG AAAGGAATTG ATTGTTATGG AAAAAGGAAA TCAAGGTATT 2760 

AAATGGTCTA GTTTAATAAT GGGTGTATTA TTATTAATGT TGGCAGTCGT TATTTTTACA 2820 

on 

TTTCCAATTG AAAATTTTTA TGCTATTACC TGGTTGATTG GACTGTTTGT ATTAATTAAC 2880 

GGTGTGATTC AAATCGTTTA CCGTAGAAAA GCAAAAGCTT TAGTAGGTGG TAACCAAAAT 2940 

TGGATTCTGT TTATGGGGAT TGTAGATATT CTATTTGGTC TATTAGTTAT TTTTAATGTT 3000 

35 

GGCGCAAGTT CAGCATTCTT TATTTATATG TTTGCTTTTT GGTTTATTTT TAGTTCTATC 3060 

TCTGGATTAT TTACGTTTTC GGGTAGTGGT AGCTTAAAAC TAATTTCAGT GATTTTTAAT 3120 

TTATTAGGTA TTGTTTTCGG TGTCATTTTA TTATTTAATC CATTAATGGG TATCGTCTTT 3180 

40 

ATTTCGACGA TGATTGCTAT TGCATTTGTA TTCGTAGGTG TCATTTATGT TGTAGATGCA - 324 0 

CTTGCTTAAG TAAAATGAAG CGGTTCAAAA GAAGGGTGTG ACATGAAGTT TGTGTCATAT 3300 

45 CCTTTTTGTT GTGTTTATGA AGCATAAAAA AGGGGCGCTA CCTACAATAA GTAAGATACG 3360 

CCCATATTTT TATATTTTAC TATTATTGTT TTTCAATACG ATTAATAGTT ACATTTAGTC 3420 

CAAAATATTT TTCTAAAAAA TGTTTATAGT TATCTTTAGT GACATCAAAT TTTTCTGAGC 34 80 

50 TACCATTCCT TGTTAAAGTT AAATGATTTT CAGACATTGT AGCACGGCCA AATGATTGTG 3540 

GCATTGTAAT TAATAAATGC TGTACAAATA TTGAATCTGG ATGCGTTTGA TTATATTCGA 3600 
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AATGATCATT TTCGAATTTT TGAACATAGA AAATATCCTT GTCTTCGTTG TTAAAAATAG 3720 

CGCGGAATGT ACCACTGATA TCAGTAATTG GTTGTGTATG CTCAGATGAA GTAATAGGAA 3780 

5 TGGCATGTAG AGGTAAGTCT CCAAAGCCAA CATCAGTTAC ATAGAATACA TCATTTATAG 3840 

AAACAACAAG TGAAGCATGT GAACCGTTCA GACTACGACC GCCACCGGGw GTGTGAATAG 3900 

TAGCTGACAT TAATTCAGGA TTAAATCCTT TTTGTTGTAA ATAGGCTTTG AAAAATGTAT 3960 

TTAATTCATA ACAAAAACCA CCACGTTTAT CATGAACAAT TTTATTAAAA AGTGCATCGA 4020. 

TATTTATAGA TATCGGCTTA CTATTTTGAA CATCAATATT TTCAAAAGGT ACAGTTAACA 4080 

TAAAACGTGT TGCATAATAA TTTAATGCTT CAATACTCGG TCGATTATAA CGAGATGAAT 4140 

15 

CAATTTGTAA ATAATTCTCT AACTTCGCAA TATTCATAAG CATAGCGCCT CCTGTATTAA 4200 

AGATTATAAT TAAATTTTAA ACAGAAATAC TGAAATTTTA AATTCGAAAG CATTGAATTT 4260 

20 TGGATAAATA CATTTTAAAT AGAAAAATAC GCTCTCAAAA TGAAGTCATC TCTAAAAGAA 4320 

ACGATTTAAA GATGACTACT GAGAGCGTAg CATAATGGAA GAAGTGTGCA GGGTGTCTAA 4 380 

AAATGCAACA ATACAAAGGT AGTTGCAAGA CAAGTTGCCT TATCTAGACC ATTTGTGTTC 4440 

25 TATGCGACCA AACTTCCAAA TTAAACTTGA AATAAGCCAA GTAATTAAAA ATAATGCAAC 4500 

TAAAATATAG CCTAAATAAT CAAATTCGAT CGAACCAATG AATGCCCAAA ACGCACCATG 4560 

TAAATCTAAC TTATCAGCAA GAATTTGTAG CAATTCAATC ATCCCAATCA CTAATGCTGC 4620 

30 

CATGACTGAT ATCGCAGTAA TCGTTATATT GTAATAGATT TTGCGAATAG GATTGAAGAA 4 680 

TGCCCAATTA TAGGCATACT TCATTACAAC ACCATCTAAT GTATCCAATA AACTCATACC 474 0 

TGATGCGAAT AAAATTGGTA AAGATAAGAT TCCGATAAAT GAAATGGCTT GTTGTGATGC 4 800 

35 

GCCTGAAGAA AGAGCGAGTA ACGCAATTTC ACTAGCTGTA TCAAAACCAA GTCCAAATAA 4 860 

AAAGCCAAGT GGCAATACGT GCCAACTACG CGTGATTAAT TTGAAATAAG GTCCTACAAA 4 920 

TCGAGAAACC AATCCTCTAG ATTCAAGTAA TGCATCGACT TCAGCTTCTT CAATGTGTTC 4 980 

40 

ACGACGTAAT TTAGCGAACA AGTTAATTAA AGAGATTAAA ATAATTAGAT TCAACACACC 5040 

GATAAGCACT AAAAAGAAAC CTGAAACTAG TGTACCAATC GTTCCACCAA TATCTTGGAA 5100 

45 ATGCGGTAAT TCATCTTTAG CCCATTTTAC AGATACCCCT AAAAAAACAG CCATTAAAAA 5160 

TACGACAGAT GAATGTCCAA TTGAAAAATA GAAACCCACA CCAGATGGAT CTTTGCGTTG 5220 

CTGTAATAAT TTGCGaACCG TATTATCTAT TGCAGCAATG TGATCTGCAT CAAATGCATG 5280 

SO ACGCAAACCT AATGTATATG CAAGAATCCC CaTACCAAAT AAGATATGAT GGTCTTTTCC 5340 

AGCAATCCAT AAAAAACTAA ACCCAATAAC GTGTAACAAA ATGACAATAG CTATGTATGG 5400 
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ATATTTAATC ATACTGTATG TTCAATGGGC ACTCTAGTAA TAAGTGTTCA TATAACAAAA 5520 

ATGTTATGCC AAATTATTTG TTATATAAAA ATATACATGT AACCACAAAA GATTTTTTGC 5580 

5 GATATATATA ATTTGATAAA TTAACCAACA ACAATGTAAG ATGTCACTTT GCTTAACTTG 5640 

GCATCCTTTT TATGATTTTC AAATTCAAAA AAATGAGCAA AATGAATCTC TTTAcCAGTT 5700 

TTTAATATTT CaATACCATG CATGGAACCT AAGCACCCAT GTGTGATGCT GGAATGGATA 5760 

10 

TTGAGACTAG CAACCTGATT GTAATGATTA GATAGTTCTT GAATTAATAT TTGAGGTCCG 5820 

TATATGTCAA AGCGGCCAGG GACAGACCAA ATAAATTCTG TTGTAACCAG TGAACGTAAT 5880 

AATTCAATAT CTAATGCTGC TGTAACAACT ATAAAATCTA TCATTTGTTG ACGTTTAGGC 5940 

15 

GCATGATTGC ATGACACATC TCCTGTTAAC TTAAAAGGTA ATGATGACTG AACTTCCGTT 6000 

TTAAAATGTA GTTGGTGCTG AAATAAAGCT TGTTC 6035 
20 (2) INFORMATION FOR SEQ ID NO: 273: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1039 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 
25 (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 273: 

30 TTTTGAACAG CCATATTTAT TCACCCTCAA CATCATTATA ATGGTATTAG TCGCATTACC 60 

TTCACTTGTT TTAGCTATAT ATGATTATAT GAGTTTTAGA ATTTCTTCTG CTATTTTACA 120 

ATTTCTAGGG GCTATCTCTT GGTTCTTTTT ATCATTGATA TTATCGCTCA CACAATTTAC 180 

35 

ACCTTTTACA TTAGCGTCAT TTATAACTTC AATTATTTTG TTCACAAGCA CAATTATCAC 240 

ATTAGCCATT GGTGGTAAGT CTGTTGAAAA GAATGATTCC CCTTAAATTC CAAATGAAAA 3 00 

AAAGGTTCTG AAGGCCGCTA TAAAACACAG TTTTTCAGAA CCTCTATACT TCTATTCAAT 360 

40 

GATATATGGT TTGCAATTTT CTACCTTTAA ATCCACAGCT TCTGCCCTTG AAACTTTGTT 420 

AAAATAAACC ATCAAACAAC GAATGACAAC TTGATGTGCA , ACAATGACAA TATCATCTTT 4 80 

45 TTGTGTATCT TCATTGACAA CATGATTCAT AAAATGTTCT ACGCGTTGAT ATACATCTTC 540 

ATAACTTTCT CCTTCAGGCG CTTTTTGTGA AAAACTATGA CGAAAGTCTT TAAAGTTTGG 600 

ATCATTGAAA TATTTTTCAT ATTTCGGATT CGCACTGATT TCATCTTTAT ATTCACCCTC 660 

SO AAATACGCCA AGTGAACGTT CTCTTAATAG AGGGGTAGTC GTTGATGCAA TGTCATATGG 720 

AAAAATATGT TCAAACGTTT GCTGTGTTCT TAATAAGTCT GAAACATATA CATGTTTAAT 780 
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10 



15 



20 



30 



35 



40 



CGGCACATCT AATTGTCCAC AAAAATAAGA TCGAAAATGT TTATTATCAT AATTCGATTT 900 

TGATTCGCCA TGTCTAACTA AATAAATCGT CATAATATTA CTCCTTACCT TATGTATTTC 960 

ATATCTACCA TAACACTTTG ACTACTAATT CGATATCAAT CTTAATATTC TATTCTAAAA 1020 

AAAGAATTAA TTCATATnT 1039 
(2) INFORMATION FOR SEQ ID NO: 274: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1496 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 274: 
GAGAGAATnT GCAATTAGTT ATTCAATTAG TTGATTTAAG ACATGATCCA ACACAAGATG 60 

ATATCTTAAT GTACAATTAT TTGAAACATT TTGATATTCC TACTTTAGTT ATATGCACTA 120 

ArGAaGACAA AATTCCaAAA GGTAAGGTyC AAAAGCATAT TAAAAATATT AAGACACAAT 180 

25 TAGATATGGA CCCAGACGAT ACAATTGTAA GTTATTCATC AATTCAAAAT AATAmaCAAC 24 0 

AACAAATATG GAATTTAATT GAACCGTATA TTTCATAGTT TTTGTACGTC AAAACTTATA 3 00 

CAAAAATTTT AAAAATAATG TAAGCACGAA ACTTTTAATT AGTACACAAT TGATAACATT 3 60 

TTTCAACGTT CATCATTTTG TCAAAAACTC AAAAGTAAAT TAGAAAGATT ATAATTTATT 420 

TAAGCATCGT ACTTAATTGG ATTTTAAATT ATGTTATAAT ATTTGTATTG TTAGTATATA 4 80 

TGGGGGCTTT TCAAATGCAT TTTATTGCAA TTAGTATAAA TCATCGCACA GCTGATGTgC 540 

ACTAAGAGAG CAAGTTACTT TTAGAGATGA TGCCTTACGA ATTGCCCATG AAGATTTATA 600 

TGAAACTAAA TCTAyTTTAG AAAATGgTCA TATTaTCAAC ATGTAATCGA ACTGAAGTAT 660 

ATGCTGTTGT TGATCAAATT CACACAGGTC GTTACTATAT TCAACGATTT CTAGCTCGTG 720 

CATTTGGATT TGAAGTAGAT GATATTAAAG CAATGTCAGA AGTAAAAGTG GGGGACGAAG 780 

CaGTAGAACA TTTATTGCGT GTCACTTCTG GTTTAGATTC AATCGTACTT GGAGAAACTC 84 0 

45 AAATTTTAGG TCAAATAAGA GATGCATTTT TCTTAGCGCA AAGCACAGGT ACGACAGGrA 900 

CAATTTTTAA TCATCTATTT AAACAGGCAA TTACTTTTGC AAAAAGAGCA CATAATGAAA 960 

CAGATATAGC TGATAATGCT GTAAGTGTGT CTTATGCTGC GGTCGAGTTG GCGAAAAAAG 1020 

SO TATTTGGCAA ATTGAAAAGT AAGCAAGCTA TCATTATTGG TGCAGGGGAA ATGAGTGAAT 1080 

TATCACTATT AAATCTTCTT GGTTCTGGAA TTACTGaTAT TACAGTAGTA AATAGAACAA 1140 



55 



1088 



EP 0 786 519 A2 



TACCAAATTT ACTTGAAAGT GCAGATATTG TGATTAGTTC AACGAGTGCA CAATCTTATA 1260 

TCATTACAAA TGAAATGATA GAAAGAATTG CAGAAAATAG AAAGCAAGAT TCACTAGTAT 1320 

TGATTGATAT TGCAGTTCCT CGAGATATTG AACCTGGTAT TAGTGCCATC ACAAACATCT 1380 

TTAATTATGA TGTTGATGAC TTAAAAGGTT TAGTTGATGC AAACTTACGT GAGCGACAAT 1440 

TAGCGGCTGC AACAATTTCG GAACAAATTC CTACAGAAAT ACATGCACAC AATGAG 1496 



10 

<2) INFORMATION FOR SEQ ID NO: 275: 

(i) SEQUENCE CHARACTERISTICS: 

[A) LENGTH : 4826 base pairs 

(B) TYPE: nucleic acid 

)5 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

20 ixi) SEQUENCE DESCRIPTION: SEQ ID NO: 275:, 

CTTGATTTTT TCCCtTTAGT ATTTTCCaTt TGanTGTCGC AGCTTCTAAA TCCTGCTTTG 60 

GTTCTCTAGT GAACTTCATA ATTAAAGCAG CTACAACGAA* TGATACAAGT GCAGCAAGGA 120 

25 AGACACCGAG TAACATGTGC AAGAATTCAC CTCTAGGTGC ATTTAAACAG TAAACTATAA 1B0 
ATGAACCTGG TGACGCGGGA CTTTTAAATC CAAATCCTGT TGCTTGATAA GTTGCAACAC ' 24 0 

CAGTCATTCC ACCTAAAATA ACAGCGATAA ATAATAAAGG ACGCATTAAT ACATATGGGA 300 

30 AATAAATTTC ATGAATACCA CCTAAGAAGT GGATAATTCC AGCACCATAT GACGTTGCTT 360 

TTGCAGTGCC TTTTCCAAAA ATCATATAAG CAAGTAAGAT ACCTAAACCT GGTCCAGGGT 420 

TAGATTCAAT TGTGTATAAA ATTGATTGAC CAGCTTTTGC AGCTTGATCT GCACCAAGCG 480 

35 

GTGTGAATAC ACCATGGTTA ATCGCATTGT TTAAAAATAC AATTTTTGCA GGCTCTACTA 540 

AAATACTTAC AAGTGGAAGT AGGTGTGCAT GTACTAATGC TTCAACTGCC ACTGATAAAA 600 

TATGCATAAT AAATTTCATA AGTGGTGCTA AAATTTTAAA TCCTGCAATC GTCATGATAA 660 

40 

ATCCTAAAAT ACCAGCAGAA AAGTTATTAA ATAACATTTC AAAACCTTGC GGCGTTCTAG 720 

GTTGAATCAA TTGGTCGGTC TTCTTCATTA ACCAACCAAC AAGTGGACCC ATAATCATTG 780 

45 CACCAAGTAA CATTGGTGTA TCAGGTAATG CAACGATGAC CCCCATAGTT GCTGTTGCTG B40 

CGATGATACC ACCACGTAAA TCATAAATTA AACGACCACC ACTAAATGCG ATCAATAATG 900 

GGATTAAATA AGTAATCATT GGTCCTGCTA AAGTAGCTAA ATCTTTGTTA GGTAACCATC 960 

50 CATTATCTAT AAAAATGGCC GCGATAAAAC CCCAAGCGAT GAAAGCGCCA XTGTTTGGCA 1020 

' TGATCATACT ACTTAAGAAT GATCCAAATG CTTGAACACG ACGACCAATT CCTTTTTTCT 1080 
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GAGAGGTTAC TTGTTACTCA ATATAAACAA AAATCAACTT TGTCAAAATA 


AATGTGACAA 


1200 




AATTAAATAA AGTGTCATCA ATGTGACAGT ATAGATATTT TGAAAAAGTA 


AAACAAAAAA 


1260 




ATTGTTTTAG GATTTTTAAA ATTTTATTGT GAAAATATTT GCAAAACAAA 


ACAACACCGT 


1320 




gTACAATAAT GATTAATGGA AAGGGGGAAA GTTCGGCAGT ACAGTTAAAG 


CGCCTGTGCA 


1380 


10 


AATAAATATT TGTATTTGAA GATTAAAGGT TAATATATGA GTGGCCTTTA 


TAGAGTGCAA 


1440 


TATATGTATT TGTAGACGAG GAGGATAGTG ATCGAATAGA TCGGCGGATG 


CTATCCCGGA 


1500 




TGTGGCTCAT TCGTTAGCTT ATTAAGTAAA ACATTAGGGT GACTTAATGG 


ACAAAGTTAA 


1560 


15 


TAAGATCGCC AGAAATTGAA TATAAAAAAT ATTAATATGG AAAGTACAGT 


GTGAGCAATT 


1620 




TGTATAGTTG TAAAAATAAC TATGCTTAAT TTGTTATGGA TGAATGCGAT 


GATAGCATGT 


1680 




TCCTATTTAT ATTATGAAAG CAGATTGTCA ATCTAAATTA TCGGCAATAA 


ATCATAATTT 


174 0 


20 


ACGCGTACTA TTCCAATATG GAGGAAAATG TCGTTATGTG TGGAATTGTT 


GGTTATATTG 


1800 




GCTATGaTAA TGCCAAAGAA TTATTATTAA AAGGTTTAGA AAAATTAGAA 


TACAGAGGTT 


1860 




ATGACTCTGC AGGTATCGCA GTAGTAAATG ATGATAATAC AACTGTATTT 


AAAGAAAAAG 


1920 


25 


GTCGTATTGC AGAATTACGT AAAGTTGCTG ATAGTAGCGA TTTTGATGGA 


CCTGTTGGAA 


1980 




TCGGTCACAC ACGTTGGGCA ACACACGGTG TACCGAATCA TGAAAACTCT 


CATCCACATC 


2040 




AATCATCAAA TGGCCGTTTT ACTCTAGTTC ATAACGGTGT TATTGAAAAC 


TATGAAGAGT 


2100 


30 


TAAAAGGTGA ATACTTACAA GGTGTATCAT TCATTTCAGA AACAGATACA 


GAAGTTATCG 


2160 




TTCAATTAGT TGAATACTTT TCAAATCAAG GACTTTCAAC TGAAGAAGCA 


TTTACAAAAG 


2220 


35 


TTGTGTCATT ATTACATGGT TCATATGCAT TAGGTTTATT AGATGCTGAA 


GACAAAGACA 


2280 


CAATCTATGT TGCTAAAAAT AAATCACCAT TATTATTAGG TGTTGGTGAA 


GGTTTCAATG 


2340 




TTATCGCATC AGACGCACTT GCAATGTTAC AAGTGACAAG CGAATATAAA 


GAAATCCATG 


2400 


40 


ACCATGAAAT CGTTATTGTT AAAAAAGATG AAGTTATTAT TAAAGATGCA 


GATGGAAACG 


2460 




TTGTAGAACG TGATTCATAT ATTGCTGAAA TTGATGCATC AGATGCTGAA 


AAAGGTGTTT 


2520 




ATGCACACTA CATGTTAAAA GAAATTCATG AACAACCAGC AGTAATGCGT 


CGTATTATTC 


2580 


45 


AAGAATATCA AGATGCAGAA GGTAACTTGA AAATTGATCA AGACATCATC 


AATGATGTTA 


2640 




AAGAAGCAGA CCGCATTTAC GTTATTGCAG CAGGTACAAG CTACCATGCA 


GGTTTAGTAG 


2700 




GTAAAGAATT TTTAGAAAAA TGGGCTGGCG TACCAACTGA AGTACACGTT 


GCATCAGAGT 


2760 


SO 


TTGTCTACAA CATGCCATTA TTATCTGAAA AACCATTGTT CGTTTATATT 


TCTCAATCAG 


2820 




GTGAAACTGC AGATAGCCGC GCCGTATTAG TTGAAACTAA TAAATTAGGT 


CATAAATCAT 


2880 
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TACACGCGGG TCCTGAAATC GCAGTTGCAT CTACAAAAGC ATATACTGCA CAAATTGCAG 3000 

TATTATCAAT CTTGTCTCAA ATCGTTGCAA AAGAGCaTGG TCGTGAAGCA GATATTGATT 3060 

5 TATTGAGAGA ATTAGCAAAA GTAACAACAG CAATAGAAGC AATTGTTGAC GATGCACCAA 3120 

TTATGGAACA AATTGCTACA GATTTCTTAG AAACAACACG CAATGCATTC TTTATCGGAC 3180 

GTACTATTGA CTATAACGTA AGTTTAGAAG GTGCGTTAAA ACTTAAAGAA ATTTCTTACA 324 0 

10 

TTCaAGCAGA AGGTTTTGCT GGTGGAGAAC TTAAACATGG TACAATTGCC TTAATCGAAG 3300 

AAGGTACACC AGTTGTAGGT TTAGCAACAC AAGAGAAAGT TAATTTATCA ATTCGTGGTA 33 60 

ACGTTAAAGA GGTAGTAGCA CGTGGTGCAC ATCCATGTAT TATTTCTATG GAGGGTCTTG 3420 

15 

AAAAAGAAGG CGACACTTAT GTCATTCCTC ATGTACATGA ATTGTTAACG CCATTAGTAT 34 80 

CAGTGGTTGC ATTACAATTA ATTTCATACT ATGCAGCATT ACACAGAGAT TTAGATGTTG 3540 

ATAAACCACG TAACCTTGCT AAATCAGTTA CTGTGGAATA ATTCACTTTT TTAGAATCAA 3600 

20 

TCATGTATTA AAATTAAAGT ATATGGCACC CTTTTAGATT AATCGACTAG AAGGGTGCTT 3660 

TTTTAGGTCG ACTTaGCTTT TACTTCATCT TAATTTGGCA GAAATGCGTa AAAATGAAGT 3720 

25 GTTTTATTTA TTTAAATAGT CTGACAATTA AGGGTGTTAT GTTAATATGA TTTTATGAGA 3780 

AGTATGGAGT AGCAATAAAG GGGTGACCTC GCATGTTAAT TCAATTAGAT CAAATTGGGC 384 0 

GAATGAAGCA AGGAAAAACA ATTTTAAAAA AGATTTCTTG GCAAATTGCT AAAGGTGATA 3 900 

30 AATGGATATT ATATGGGTTG AATGGTGCTG GCAAGACAAC ACTTCTAAAT ATTTTAAATG 3 960 

CGTATGAGCC TGCAACATCT GGAACTGTTA ACCTTTTCGG TAAAATGCCA GGCAAGGTAG 4020 

GGTATTCTGC AGAGACTGTA CGACAACATA TAGGTTTTGT ATCTCATAGT TTACTGGAAA 4080 

35 AGTTTCAAGA GGGTGAAAGA GTAATCGATG TGGTGATAAG CGGTGCCTTT AAATCAATTG 4140 

GTGTTTATCA AGATATTGAT GATGAGATAC GTAATGAAGC ACATCAATTA CTTAAATTAG 4200 

TTGGAATGTC TGCTAAAGCG CAACAATATA TTGGTTATTT ATCTACCGGT GAAAAACAAC 4260 

40 

GAGTGATGAT TGCACGAGCT TTAATGGGGC AACCCCAGGT TTTAATTTTA GATGAGCCAG 4320 

CAGCTGGTTT AGACTTTATT GCACGAGAAT CGTTGTTAAG TATACTTGAC TCATTGTCAG 4380 

ATTCATATCC AACGCTTGCG ATGATTTATG TGACGCACTT TATTGAAGAA ATAACTGCTA 4440 

45 

ACTTTTCCAA AATTTTACTG CTAAAAGATG GCCAAAGTAT TCAACAAGGC GCTGTAGAAG 4500 

ACATATTAAC TTCTGAAAAC ATGTCACGAT TTTTCCAGAA AAATGTAGCA GTTCAAAGAT 4560 

SO GGAATAATCG ATTTTCTATG GCAATGTTAG AGTAAATATT TTGCAAATAA TAAGTAATAA 4620 

TGACAAAATT TAATTAAGAT AAAATGGACA GTGGAGGGCA ATATGGATAA CGTAAAAGCA 4680 
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AAAGATGTCA TTAATCAATT GAGAGAGAAA GGATATAAAG TATTTTTGGC AACAGGACGT 4 800 

TCGCATTCTG AAAATACATC AACTTG 4826 
5 (2) INFORMATION FOR SEQ ID NO: 276: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 484 6 base pairs 

(B) TYPE: nucleic acid 

10 (C) STRAND EDNESS : double 

(D) TOPOLOGY : linear 



Ui) SEQUENCE DESCRIPTION: SEQ ID NO: 276: 

GAATAAAAAG TAAAATTACT CGCCTTTGTT ACCTTTTACT TTATCAATaA AATCAGTTGC 60 

TTTTTCTTTT GCATTTTCAA CGAATTCTTT CGCTTTACCA GAAGCTTTAT CTTCTTTACC 120 

20 TTCGTTTTCT AAATTTTTAT TATCAGTAAC ATTACCTACT GTTTCTTTAA CATTACCTTT 180 

TGCTTGTTCA AATTTACTTT CGTCTGCCAT AATAAATGCC TCCTCGGAAT AATTAAATGT 240 

TATATATAAT ACTTACCCAC TGAAAAATTA TCTAAACATT TTACTTAAAT AATTTTTGAT 300 

25 ATTGATTTGA CGTCATTTTA TAACTAGCGA AATAGATTCA TCATTAACTT GAGGGAGTGG 360 

GACTGAAATA ATAAAGAATC ACTAATGATT TATGATGTAT TAGTCACTAG CCATGTGAAA 420 

TTAAAAATAA GAATAAATGA GTAGCACGCA TGCATATAGG ATTTTACTTT ATCCGTAATA 4 80 

30 

GCATCTCATT CCTAAATATC ATATAAATAC CTGTTTAAAT TAAAAAGCCC AGCAACATCA 540 

CGTTACTGAG CCATTAATAT GATTTATTTA GCAGGAATAA CTGCACCATT GTATTTTTCA 600 

TTAATGAAGT CTTGAATATC TTTAGATTGT AATACTTCAA TTAATGCTTT GATTTTCTTA 660 
35 . 

TCATCTTGAT GTCCTTCTTT AACAGCAATT AAGTTTGCAT AAGGATTATC TTTCGCACTT 720 

TCTACAGCAA TAGAATCTTT TTTAGGATTT AGTTTTTGTT CGATTGCAAA GTTCGAATTA 780 

ATGATAACAG CATCAGCGTC TTCATTTTGA TAAATTTTAG GTAAGAATTC TGCTGATTGT 840 

40 

TTATTATTAA ACTTAATATC TTTTTTATTC TCTGTAATAT CACTAAACTT AGCATCTTCA 900 

ATTTTTACGC CTTTTTTGAT TTTAATTAAA CCTGCATCAA CGAAGAATTT TAAGAAACGT 960 

45 CCTTGTTCAG CTGGATTATT AGACACATAG ACTGTTGCAC CTTTTGGTAA TTCTTTTAAA 1020 

CTTTTATACT TTTTAGAGTA TACAGCCATA GGTTCTAAGT GAACATCACC GGCACTTACG 1080 

ATTTTGTAAC CTTTATCCTT TTTCTCTGTG TTTAAATATG GTGTATGTTG GAAATAGTTT 114 0 

SO GCGTCAATTT CACCTTTGTC TAGTAATTTA TTAGGTGTAG TGTAATCGTT AATTGTTTTA 1200 

ATATCTAGTT CATAACCTTT TTTCTCTAAT AATGGTTTTG ' CTTTTTCTAA AATTTCAGCA 1260 
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TTACCGCAAG CTGCTAATAC AACTGCAAAT 
TTCATAAAAT GAAACCCCCA ATTTATCGTT 
5 TGAATTGGAT TATAAATACA ATAATTAAAA 
TTTGATTTCG AGTGAAACCT GTTAAGTATG 
CACCTGCAAC TGCTGTTGAA CCAACTAAAG 

10 

GCGCTGGCAT AGCTTCAGGT AAAAGGACTT 
TTGACCAAGC CGCTTCGATG ACACCTTTAT 
TTGCATAAAA CGGTGctGCG CCAATGATCA 

15 

TCGTTCCAAG TATCAAACTT GTAAATGGAA 
TCGCTCTAAA TAAGTTAACA ATGAAAGAAA 

2Q ACTTACCTTT AGCAGACAAG AATAATAACA 
ATATAGTTGA GACGACTGTC ATGTATAGTG 
ACTGAATATT AGGCATTGTA ATCATTTCAT 

25 CTTAACACCT CCATTTTAAC TTGTCGCTCA 
ACACTTGAAA TATATGGAAT ATGCAGAACT 
TTAATATTTG CTTCTAAAAT ATTAATTTTA 

30 ATAGGCTCGG TTGTTGTTGA ACCAGCGAAA 
AATGGCTCTA ATTCTGTTAA AGATGTTTCG 
CGTTTTGTCA CAGTGTGTTG CGGATTTTCA 

35 ACTTTACCAC TTTCCATAAC TGCAACTTCA 
TGCGTAATTA GTACAATTGT TAAATTTTGT 
atttCatctg TTGTTTGCGG ATCAAGTGCA 

40 

GGATCATTaG TAACGCTCGT GCAATCCCAA 
ATGGATAAGC CTTTTCTCTA CCTTTTAAAC 
GCTTAGCTCT CCTTCTAGGG ACACCTGCAA 

45 

CAGTCCTTGA CCATAACAAA TTAAAATGTT 
CTCTTAATCC ATTTTTGGAC AATTGACCTA 
SO ATGTAGGCGC TTCTAAATGA TTAAACATTC 
AACCAATGAC GCCATAAATC GATCCTGCTC 

55 



GTTAATACTA 


AAATAAGACC 


AAATAATTTT 


1380 


TATCAAGTTT 


ATTTGTAAGC 


CAATCCCCAA 


1440 


TAAAAACTGT 


TGATACTAAA 


ATGACATCAT 


1500 


CTAAATTTCC 


TAAACCACCG 


GCACCAATTA 


1560 


CGATTGCTGT 


AACTGTAATG 


CCAGACACTA 


1620 


TACGAATTAC 


TGTCCAAGTA 


TTAGCGCCCA 


1680 


CAATTTCTTT AAAAGCAATT 


TCTACGAGCC 


1740 


AGGCTGGTAA 


CGCACCTGTC 


GGACCACTTA 


1800 


TTAATAATAA AATTAAAATA ATAAATGGTA 


1860 


CGATAGAATA 


AAATAACCTT 


GCACCGATAG 


1920 


CACCTAAAAT 


AAGACCAAGT 


ATAAATGCAA 


1980 
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ITjCAGTCCAA 


ACTTCTGGCC 


2040 


1 ±J\lJv\± 1 1\_ 


AL 1 AAAITjA i 


rTACCCATGT 


2100 




111 LuAAJ. i. 1 


i t-WGAAATCT 


2160 
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TTTTGTATTT 


2220 


ATATCATAGG 


CAGTTGATAG 


ACTCGATACA 


2280 


ACTAATCTAA 


CGATATATGC 


ATCTTTTTCT 


2340 


AAATCATCAT 


TTAAATCGTC 


TTTCACAAAT 


2400 


AAAACCTGTG 


TCACCGGTCC 


TTGTTCTATC 


2460 


TCACAAATAC 


GACGAATGAC 


ATGCATTTCA 


2520 


TGTTCTCTAA 


TTTTTAGTAG 


TAGATCTAAA 


2580 


CTTGTTGCCT 


CATCACAAAG 


CAAGACCGTT 


2640 


CACGTTGCTT 


TTGTCCACCT 


GATAACTCTG 


2700 


CGACGAGTTC 


GACAAGTTCT 


AATGCTTTTT 


2760 


TTTCAAGCGG 


AAACATAATA 


TTTTTTAACA 


2820 


GGAAGATCAT 


ACTTACTTTT 


TGTCTTTTTG 


2880 


TATGGTCTCC 


ATCTATAATA 


ACTTCACCTG 


2940 


GAATCAAAGT 


ACTTTTTCCT 


GCTCCAGAAA 


3000 


GAATCGATAA ATTAACGTGA 


TCTACAGCAA 


3060 
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TTCCTCCCTG TGTTGCTTAA TAAAATAAAA AATGCTTTCT CAATATCGAT AGAAAAATTG 3180 

AGAAAGCAAT AGTAGTATTG TTTCTCTCAT CTTCAAAAGT TAAAACTTTA TGTGAATTGG 3240 

CACCATTTCT ATATAAGACG GTTGCCGGGC TTCGTAGGGC ACATCCCTCC ACCACTCTCG 3300 

ATAAGAGTTT ACGCATCATT TAATTTGTAT TAATCCTAAC ACCTTAGTAA AATTTCGTCA 3360 

ATAACTATTT TAAATTTTCT AACAAATCAG TCACCGATTT AAATGCATAA ATTCGTTTTA 3420 

CTTCTTTATC TTTATTCATC AACAATAAAA TCGGCGTAGA CATGATTTGC ATATCTTTAC 3480 

AAAACTGAGG ATAAAAGTTT AAATCTATTT TCAATAATGG TAACTGCAAT ATTTCATTAG 3540 

CAATGTCTAA CATTCTTTCT GaAACCTTAC AAGTACCACA CGTTGGTGTA TAACCAAAGA 3600 

TTAAATGTTT GTCTTCCTCA TAAAATGTAG TTACATCTTT GATGTCTAAT GAATTATTCA 36 SO 

TTTACTAAAA CTAACCTTTC ATTATTTATA TTCGGTAAAA GAGGTGTTTC TTTCTTACAA 3720 

2o GTAAAGCCAT GTTTTGAAAG TACATGCGCC AAATATTGTT TGGGGCAATT CGCAACTTGA 3780 

CAGTAAGTTT TATCAATAAA TATATGTTCA CTTTCACTCA AATAACGTTT AAACCAATTT 3840 

CTAATTCGAT CTCCTTCGTC ATCAGAATCG GCTAATACAA AAACTTGTTT ATCATACAGT 3900 

25 GATTCTATCA TATCATCAAG CTTATCTATA CTCATTGTTC CATGAGTACA AATAATATTG 3 960 

ACTGGTTCTG CAATAACCTG TTGCACCCTT TTTTTATCAG ATTTTCCTTC AACAATTATC 4020 

ACTTTATTTA CAATAGCCAT CATCATCACC CTTTAAAATC AATAAACATC TGTCACTGTA 4 080 

TCATTTCACA AAATTGGTAT GAATAAAACA TAAATCACAA AAAATTTAAA CTAGCTTAAT 414 0 

ATAATAATTA CAAACTCAAT GTTTGACTAG CTGGAACATT TAACATAAGC AGACAAAGGC 4200 

TAAGTCAAAA ATCAACATCC TAAAATCTAC AATGTTATAT TAACAATAGT TAACCAAAAG 4260 

AAAATACACC TATAACAAAC TTTTCAATTA TAGCGGGGCC CCAACACAGA AGCTGATGGT 4320 

AAGTGAGCTT ACAATAATGT GCAAGTTGGC GGGGCCCCAA CATAAAGAAA TACTTTTTCT 4380 

TTAGAAATTA GTATTTCTTA TGCATGAGTT TTACTCATGT ATTCCTATTT TTAAATACAC 4440 

40 

ATTAGCTGTG GCTTATGAAA ACAGGCTGGG ACATAAATCA ATGTTCTATG CTCTACGAAg 4500 

TTATATTGGC AGTAGTTGAC TGAACGAAAA TGCGCTTGTA ACAAGCTTTT TTCAATTCTA 4560 

45 GTCAGGGGCC CCAACACAGA GAATTTCGAA AAGAAATTCT ACAGGCAATG CAAGTTGGGG 4620 

ATGGGCCCCA ACAAAGAGAA ATTGGATTCC CAATTTCTAC AGACAATGCA AGTTGGGGTG 4 680 

GGACGACGAA ATAAATTTTG CGAAAATATC ATTTATGTCC CACTCCCTAG ATTGATCTAT 474 0 

SO AGATACTACA CTTATTAAAG TAATATATTT TTATGATTCT CTTAGCTGCA ATCCCATGAA 4 800 

TACATGTAAT CATCAAACTT CATAGCCTCA AGGTCAGTAG ATTTCA 4 846 



30 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1843 base pairs 

(B) TYPE: nucleic acid 

£ (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

w (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 277: 

AACAAAGACA CAATCGAACA TGAACCATCA GTAAAAGCTG AAGATATATC AAAAAAGGAG 60 

GATACACCAA AAGAAGTAGC TGATGTTGCT GAAGTTCAGC CGAAATCGTC AGTCACTCAT 120 

15 AACGCAGAGA CACCTAAGGT TAGAAAAGCT CGTTCTGTTG ATGAAGGCTC TTTTGATATT 180 

ACAAGAGATT CTAAAAATGT AGTTGAATCT ACCCCAATTA CAATTCAAGG TAAAGAACAT 240 

TTTGAAGGTT ACGGAAGTGT TGATATACAA AAAAAACCAA CAGATTTAGG GGTATCAGAG 300 

20 

GTAACCAGGT TTAATGTTGG TAATGAAAGT AATGGTTTGA TAGGAGCTTT ACAATTAAAA 360 

AATAAAATAG ATTTTAGTAA GGATTTCAAT TTTAAAGTTA GAGTGGCAAA TAACCATCAA 420 

TCAAATACCA CAGGTGCTGA TGGTTGGGGG TTCTTATTTA GTAAAGGAAA TGCAGAAGAA 480 

25 

TATTTAACTA ATGGTGGAAT CCTTGGGGAT AAAGGTCTGG TAAATTCAGG CGGATTTAAA 540 

ATTGATACTG GATACATTTA TACAAGTTCC ATGGACAAAA CTGAAAAGCA AGCTGGACAA 600 

30 GGTTATAGAG GATACGGAGC TTTTGTGAAA AATGACAGTT CTGGTAATTC ACAAATGGTT 660 

GGAGAAAATA TTGATAAATC AAAAACTAAT TTTTTAAACT ATGCGGACAA TTCAACTAAT 720 

ACATCAGATG GAAAGTTTCA TGGGCAACGT TTAAATGATG TCATCTTAAC TTATGTTGCT 780 

35 TCAACTGGTA AAATGAGAGC AGAATATGCT GGTAAAACTT . GGGAGACTTC AATAACAGAT 840 

TTAGGTTTAT CTAAAAATCA GGCATATAAT TTCTTAATTA CATCTAGTCA AAGATGGGGC 900 

CTTAATCAAG GGATAAATGC AAATGGCTGG ATGAGAACTG ACTTGAAAGG TTCAGAGTTT 960 

40 

ACTTTTACAC CAGAAGCGCC AAAAACAATA ACAGAATTAG AAAAAAAAGT TGAAGAGATT 1020 

CCATTCAAGA AAGAACGTAA ATTTAATCCG GATTTAGCAC CAGGGACAGA AAAAGTAACA 1080 

AGAGAAGGAC AAAAAGGTGA GAAGACAATA ACGACrCCAA CACTAAAAAA TCCATTAACT 1140 

45 

GGAGwAATTA TTAGTAAAGG TGAAyCgAAA GAAGAAATCA CAAAAGATCC GATTAATGAA 1200 

TTAACAGAAT ACGGACCAGA AACGATAACA CCAGGTCATC GAGACGAATT TGATCCGAAG 1260 

50 TTACCAACAG GAGAGAAAGA GGAAGTTCCA GGTAAACCAG GAATTAAGAA TCCAGAAACA 1320 

GGAGAyGTAG TTAGACCACC GGTCGATAGC GTAACAAAAT ATGGACCTGT AAAAGGAGAC 1380 

TCGATTGTAG AAAAAGAAGA rATTCCATTC rAGAAAGAAC GTAAATTTAA TCCTGATTTA 144 0 
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CCAACACTAA AAAATCCATT AACTGGAGAA ATTATTAGTA AAGGTGAATC GAAAGAAGAA 1560 

ATCACAAAAG ATCCGATTAA TGAATTAACA GAATACGGAC CAGAAACGAT AACACCAGGT 1620 

CATCGAGACG AATTTGATCC GAAGTTACCA ACAGGAGAGA AAGAGGAAGT TCCAGGTAAA 1680 

CCAGGAATTa AGAATCCAGA AACAGGAGAT GTAGTTAGAC CACCGGTCGA TaGCGTAACA 174 0 

AAATATGGgA CCTGTaAAAG GAGACTCgAT TgTaGGAAAA AGarGAATTc CaTTCaGGAA 1800 

AGAcGTaATT TaTCCTGTTT AGCACCCGGG GCAGAAAAGT TAC 1843 
(2) INFORMATION FOR SEQ ID NO: 278: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH; 853 6 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 278: 

TAAACAGCGC GTGTACTTGT GATTCCCCCT TCTTCTATTT TACCCACCCG GGAAATAATA 60 

CTTTTCGCGA TTCCTTACTT GaACAAGCAA TATTTTATCa GCTGTTTCTT CAACTAAACA 120 

GACACATTTA ATCATCTTTG ACACCCCAAC TTTGTGAAAT CAATTTTTCA AATTATACTG 18 0 

TACAATTATG TTATCATATA TGAGTAGTTA TAGCGCAAAA CGTTAGCAAT TCAGCGCACC 24 0 

CAACTTTTCA TATAAACAGA AGATACTAGG GGGAATTATT ATTATGGCAA AACgTTCCAA 300 

ATCACAACGT TTATCAAGTT TACTAAATGT CGCAGGTTTC ATAGTCGACG GCTACAATGG 360 

CTATAAATAT CATGCTAAAA ATAAAAAATT AGTATATCTT TCATTAGGTT TAAGCACTGT 420 

AGGAACCGTG TTAGACTTTT ACATTTCAAT TAAGTCACCA CGTAAGTTCA AAAAAGCAGT 480 

GGCAGTTGTT ACTTTAATAA CAAACGGTGC TAGATTATTT ACAAGCATTC GCAAAGTAAA 540 

40 ACATGAATAC TAATTCAGAA AAGGATTGGT CGAACATAGA ACATGAAGTT CATTCGACCA 600 

ATCCTTTTTC ATATACAAAA ATTCCTATTA CAACAATCAC GACTTTGATA GCCCCGCCAT 660 

AAAATTTAGG ATTCAATCCA ACTTTTCAGC TTGTGaAATG TAATAGGaAT TCATTATATA 720 

TTTATATACG TAAGACTTTA GTGAATATAT CTATAATTAT TTACTTGGTA AGCTGGTACC 780 

GTTCTGTAAG TTAAAATACC TGGTGCAGCT GAATAGTTCA TTTCTGAAAC TAAAATACTA 840 

CCATCGTTAT TTACACGTTC TACAAACATA ACATGACCAT AGTAACCTAC ATCTGTTTGA 900 

GCGATAGAAC CTACAGTAGG TCTATTGTCG ATAGTGTAAC CATCTGCTGC CGCTGCGTTA 960 

TCCCAGTTAT TAGCATTCCA CCAATAAGTA CTAATACCTT TACCAATTTC AGCACGACGA 1020 
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GTATTGTAAC 
ACTTTCAATT 
TTTTGATAAG 
GTATAGTATG 
CTTGAGCTAG 
AAACCATTAA 
AATGAGTCGC 
CTACTATTAC 
AGATTAGATG 
GAAATTGCCC 
GTTGCCGCAA 
ACTTTAAAAT 
CTACATCATT 
CAAAAAAATC 
TATTAGATTT 
ACAATCCCTT 
AGCATGAACT 
CTTAATCTCA 
CGCTTTTTGA 
CAAGTCTTTG 
TTTTTCTAAA 
ATTAATAACT 
AGTAATTTTT 
ATCTTTTTTC 
TGACACATCA 
TTTATCTGAG 
TCCTTTATGC 
AATATCACCA 
CACATCAATA 



CTCTATTTGT 
TTTGACCCGG 
TTGTACCATA 
ATCCGCCACC 
CAGTACCTGA 
GTCGCATAAT 
CTGCTTGTAC 
TCGTAGAATT 
TTAAATTGTT 
ACACTGATTC 
CAGCGCTAAT 
CCTCCTCTTG 
ATACGATTTT 
ATATACTGTA 
TACAATATCT 
TCTCTATTGG 
TTGCTTGTAG 
TCTTTAGATA 
GCTTCTTTTG 
TCATTAACTG 
AATATCGGAT 
GCAATATCGA 
AAATGTTTTG 
AGTTTTATTA 
TTTGGAATGA 
TAAATGCCCA 
GCCTTTTTAT 
TCATTTAATG 
TCATCTTTTT 



CGTTGTTGCA 
ATATATAAAG 
TTTTGATGCA 
TGAGTTCGTT 
TACTTTTAAT 
GTTTTGGTAA 
TGTGTAGTAT 
ACTTGAGCCA 
TAATGACTTT 
ACCCGGTTTT 
CGCGCTTGTC 
CTTAACTTTC 
ATTATGTATA 
TCATCAAATT 
AAATTATTAC 
AAATAATTTT 
GACGCAATAT 
AATTAACAGG 
AATGATACAA 
CAACAATATT 
CATTTTTAGG 
CATCAGATAA 
GATTTGACGT 
AACCAGCTGC 
CAACTTTAGC 
ACGGTGCTAA 
ATTGATCTAA 
CTTTATTCGG 
TAGCTAATTC 



GATCCTGAGT 
AAATTATTTA 
ATTAATGACA 
GATGGACGGC 
TTTTGACCTG 
GTTGTACCAT 
GATCCGCCAC 
GATACTTTTA 
AATTTAGCAA 
ACTGTGTGAG 
CCAATAATAG 
CTAACATTCT 
ATAGGTTGAT 
TTATAATTAT 
AATTTCATAA 
ATTCTCCAAC 
AATTTATTTT 
TTTCTCTCCA 
TTCTACGATT 
AATATATGGC 
ATCTTTACCC 
AGCACGTGCA 
TATATCTTTC 
TTCTAATAGT 
ACCATCTTTA 
AACTGTTGTA 
AAATGCAAAA 
TAAATTGTAA 
TTTAACCTTC 



TCGTAGATGC 
AGCCATTTAA 
ATGAGTCACC 
TACTATTGCT 
GATAAATAAA 
ATTTTGATGC 
CTGAGTTCGT 
GTACTTGGTT 
TCGAAATCCC 
TTGTAGCCGC 
CTGCAATTAC 
TTTATCCGAA 
GTTTGATGAC 
CCCTTAAAAT 
TATTTCACTA 
AATAACGCCC 
GCTAATGACG 
TCTTTGACAT 
TTAGCATATG 
TTTACTGCAT 
GCTTTAGTTG 
GTTTGTTGTG 
ACCGTGCCTG 
TTAAGTGCAC 
ACCTTTTTGA 
CTTAATGCTG 
TGTTGGAATG 
TCTGAGAAGT 
TCCCAAGCCT 



aTTACCAGTT 
GCTCATAATT 
TGCTTGTACT 
CGCAGCGTTA 
GAAATTATTT 
GATTAATGAT 
TGATGGACGG 
TGGGAAAATT 
ATACTTATTT 
ATTTGCTTGA 
TTTTTTTTGC 
TTTATGAATA 
ATTATGaTTA 
TATTACAACT 
TAAAATGATT 
TACAAACATA 
TTTCTATTGC 
CTTCCTGCAA 
TTTTGTTATC 
CTGAATTTGA 
CTACACCGTT 
CATCTACTGC 
CTAATCCGAA 
GTGCTTGGTT 
CATCTTTAAT 
AAATCTTTGT 
CATTCATATC 
GCTTAATCTC 
TAGTGTCATT 



1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
2220 
2280 
2340 
2400 
2460 
2520 
2580 
2640 
2700 
2760 
2620 
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AAGTGCTACG 
CACTATATAT 
CACTTGGACA 
TTGATAACCA 
CGCCGTACTT 
AGCTTCAGGA 
CGCTTCAATA 
AGGTGCCACA 
TACTAATTTT 
AATATTGATT 
TCGAGTAATT 
AATAGATACC 
AGAACCAAAC 
ATTTATTGCC 
GGTGTTACCT 
TTGAATCAAG 
ATCTTTAAAA 
AGTCTGTATA 
CTCTTTAAcA 
AATGTCTTTA 
ATTGACATTC 
TGCTTCATCG 
TTGCTTCTGC 
AAATTCAAGC 
GAGTGGCATT 
TATCATACCG 
ATGTCCATCT 
CAACGTACTT 
CGTAAATGAT 



ATAACTAACC 
CATTAATGTC 
ATAATGACTA 
TACACTAAAG 
CCAATAAGTC 
ATTAAAAAAT 
ATCCCCTCGT 
TATACTGTTA 
GTGAATGGCA 
AAAGGATTTA 
ACCAATAAGA 
ATATATAGCG 
ATATGTTAAT 
GTGTCTTCAA 
TGTATTTCTG 
TCATTTATAA 
TCGCCAACTT 
ACTGTAGACA 
GTTCCTGTTT 
ATAACGCGCA 
TTTAATAACG 
CATAGGAGTA 
CCACCAGATA 
ATTTCCGTTA 
GCTACATTTT 
ATATCTTTCT 
ACAATCACTT 
TTTCCTGCAC 
ACGTCCTTCA 



CAATCAATCT 
TACGTATGAA 
ATACAATAAC 
CTAAGTCTCC 
CAATAATCGC 
ATCTAATGAT 
CTACTTCCAA 
AAGGCACGAT 
CAATCGCAAT 
AAACTTGATG 
CACCTAATGG 
TTTCGTACAA 
GcACCTCCTC 
ATTGTTGATC 
ACATAGATGA 
TCGGTTGTGT 
GTTCGTCATT 
CAAAATTTTG 
CAACCACTTT 
TTTCATGTGT 
TCAATATCGA 
TTTTCGGATT 
ATTCATCAGG 
CTCGTTGCTT 
TAAATACGGT 
TAATATCCCT 
GTCCATTCGA 
CACTATATCC 
AAGCATCTAT 



TTTCATTCTA 
TCTAGCTAGA 
GGTAATAATA 
TATACCACCA 
AGTGGTAATT 
TTGTAGTGGT 
TAATGAGTTT 
GGCAGCAGTC 
TAACAAAATA 
TATCACTATA 
AATACCAATC 
TGCTTGTAAT 
AAATTGAATA 
CATATTAAAT 
AAATAAAATT 
CACCTGAGTT 
CAATCGACGA 
AGCAATCGTC 
CCCCTTTTCC 
AATCATCATA 
AGCAGTCGTT 
AGTAACAAGC 
AAATTGGTCT 
AATTTCTGTT 
AGCTGAATTT 
CATCATTTTA 
GGCAGCTTCA 
AATCACACCA 
TTTTTGCTTC 



TCAATTCCTT 
ACATTCCCTA 
ATGACCGTCG 
CCGCCAACAG 
GCTAATACTA 
GAAGCGCCCA 
TCAACAAGTC 
GTACCAATTG 
ATAAATGGTA 
TTGGGCCATA 
ACTGCTCCTA 
AACTGTGCAC 
TTTTTCTCTT 
CGAAGCCACA 
TTAACCTCTC 
TCCTCGACGA 
ATCAATGATG 
GTTTTAGGAT 
ATTACAGCAA 
ATTGTAATGC 
GCTGGATCCA 
GCTCTTGCAA 
TTTTTATCAC 
TTGCTTTTCT 
AATAAATTGA 
TCGCTATAAT 
AGATGATTCA 
AAAATATCAT 
TTTTTATTAA 



TCAAAATCTT 
GCGTTTGAAT 
TATCAAATCT 
CTCCTGCCAT 
ACGAACCTAA 
TCGnTTTCGC 
TTGCAATGTA 
AAGTACCTAC 
GTGACCTTAA 
TGCCTTGTTT 
AAAATAAAGC 
TGTCTAAATC . 
TGAAATATTG 
TATAACATAC 
TGCCACAAAT 
AGATTTTATA 
TACTTGGCTC 
GACTAAACAC 
CACGATTACA 
CAAAGGTTTG 
ATGCGCTTGT 
TAGCCACCCT 
TCAATCCTAC 
TACTTAAAAT 
AATGCTGAAA 
TCGTAATATC 
CGAGTCTTAC 
TGCGATTGAC 
AGGTCTTACT 



2940 

3000 

3060 

3120 

3180 

3240 

3300 

3360 

3420 

3480 

3540 

3600 

3660 

3720 

3780 

3840 

3900 

3960 

4020 

4080 

4140 

4200 

4260 

4320 

4380 

4440 

4500 

4560 

4620 
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TAAGAGCATT ATATGTAAAA TTGCATATAT CGTcAATACA ATTTGCCGAA TTTTCTAAAA 4740 

AATTAAAAAA TAAGTAATTC ATGTGACAAT GACGAATTGT GAGACTACTA TGACATTTAT 4800 

CAAATTAAAT CCATAAAAAT GTCCACCAAT CCTCCACAAC GCAATTACTA AATATTAACA 4860 

TCGCACAAAA AAGCACTAGC ATATTCAAGA ACAACAAACG TTGAACTCAA AATATATGCC 4920 

AGTGCTGCTA TTATTTATAA AGTATCTAGT GCTTGTTTTA AATCATCGAC TAAATCTTCA 4980 

GTATCTTCAA TACCTACAGA AATTCTTACA AGTCCGTCTG TAATACCTTC TTTAGCTCGA 5040 

ATATCTGCTG GAATGGATGC ATGTGTCATC AATGCAGGTA CTGAAATTAA ACTTTCCACT 5100 

GCACCTAAAC TTTCAGCTAA TGTGTAATAC GATGTTGCTT TAATCAATTG TTTGGCACTT 5160 

TCTGTATTTT TCACTTCAAA TGCAATCACA CCTGTATGGC CATCCGCTTG AGCCATATGG 5220 

ACATCATGAT TTAAATGACT TTCAATACTT GGATGGAACA CTTGTTGCAC AGCTGGATGT 52 BO 
20 GCTTGTAACA TTTTAATAAT TTCAATAACG CTGCGATTAA TTTGTTCCAT ACGTAAACCT • 5340 

AATGTTTTAA TACCCCTCAC AAGTAAATAG CTATCTTGAG GTCCTAAAAT GCCACCTGTT 5400 

GAATTTGAAA TAAATGCTAA ACGTTCTGCA AGCTTGTCAT CCGATGTTGC AACTAAACCA 5460 

25 GCAACGACAT CACTATGTCC ACCTAAATAT TTCGTTGCAG AATGTAAGAC AATATCGATA 5520 

CCTAAATCTA ATGGATTCTG ATAATAAGGT GTCATAAATG TGTTATCAAC AACTGAAATC 5580 

AAACCGTGTT CTTTCGCAAT TTCAGCAGAC TTTTTAATGT CAGTAACACG TAATAATGGA 5640 

TTAGAAGGTG TTTCAATAAA CAACATCTTT GTTGTTGGGC GTATCGCTTG TACAATTGAA 5700 

TCTGTATGCG TTGTATCTAC AAAATCCACT TCAATGCCAA ATCGTGTAAA TACTTTTGTC 5760 

AATGCGCGAT AAGTACCGCC GTATACATCT GAATTTAAAA TAATATGATC TCCTTTGTCC 5820 

AACAGCATAA CAACTGCACT GATTGCTGCA ACACCTGAAC TAAATGCAAA GCCATGTTTG 5880 

CCATTTTCTA ATGTCGCAAT AACGCTTTCT ACAGAACTTC TTGTTGGATT CGCAGTACGA 5940 

40 GAATATTCAT ATCCTTGACG TAAATCACCA ATATCATCTT GTAAATATGT ACTTGTTTGA 6000 

TAAATTGGTG TTGTAACGGC ACCTGTATAA TCGTCTGTTG TGTGCCCACC ATGAATTAAT 6060 

TTAGTTTTCT TGTTCATTAT TATTCTCCTC ATAATTAAAT ATTTGCTTAG ACATATATCG 6120 

ATCACTACCA TCTGGAAATA CGACAACAAT CGTACCTTCA GATAATTGCG CTTTTAAATT 6180 

CAATGCACCT TGTAATGCTG CACCTGaAGA ACTGCCTACT AACAACCCTT CATTTATAGC 6240 

CAAACTTTTG ACATTTCGAA AGGCATCTTG ATCTTTAATC GTAAATATCC CATCTACAAG 6300 

. ACGTCTCTCT AAAAATATCG GCCATTTCTC AGAACCGATA CCTTCAGTGT CATGTGCATG 6360 

AGCTGGCCCT CCATTTAACA CGGACCCTTC TGGCTCAACG GCATAACATT GCACGTGATG 6420 
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ATAATCAATT TGCTGTAATG CTGAAGTCAA TTCGGGTCCC AATGTATGAA AATATGTATC 6540 

CGGATTATGT TCGGATTCAA ATTGATTCAT ATAAACGGCA CCATATTTTT CAGCATAGGA 6600 

ACGTGCAGCT AATTGTGCCC CATGCATACC TTCAGACTGA CTCGTCCTTG AAACTTCTGC 6660 

ACCAAGCGCT ATCATAATAT TAATCTTTTC TTCTGAAAAA CCATACGGCG CAAAGATCTT 6720 

ACATTTCAAA TGATGTCTAT TCGCTGCAAT AGCTAACCCT ATGCCTGTAT TACCAGCAGT 6780 

CGCTTCAACA ATAGTTTGAC CTGCACGCAC ACGCCCTTCT TGAATTGCCT TCTCTACTAA 6840 

ATATTTCCCG AGTCTGTCTT TAACACTGCC TCCAGGATTC CATTGTTCAA GCTTGGCATA 6900 

AATTTTAACT TTATCATCAC TATAATGTTC TAACAGTACT AATGGTGTAT TGCCaATTAA 6960 

ATCATAAGTA ATCATAGATG CACCCTCATC TGACATGCCG ATCAAATGAA TGAAACCTTT 7020 

CTTCATGTCT CAATTTTAAT TCTTACTTTT CAGATAAGAA TTATAAACGA CATTTTGTTA 7080 

20 TTTTGCAATT ATCTAAGTTT CGATTAATTC AGAACCAGTA CTAAATTTTC AATTCCAAAC 7140 

AAAAAAACAC CTGAGCAACA CAAATACTTG TGTGTCAGAT GCTTCTATAT ATTAACTAAA 7200 

TAATTGCACG ATAAAGACTA AAATAATAAC GACAGGCATC GCATACTTAA TTAAGTAATA 7260 

& CCAACCACTG AATAATCTAA ATCGATCTTT ACCAAAATAT TGTTGTAATA ATTTTTTATC 7320 

TAATAATTGT CCTACGACAA GCGTAGTACC TAATGCGCCT AATGGCATCA ATACATTCGA 7380 

AACGATGAAA TCCATATTAT CAAAAATCGT TCCCGCACCG AATCTTACAT CTTTTAAGAT 744 0 

ACCAAAAGAT AAGGTTGCTG GAATACTAAT GATAAATACT AAAATACTAC CGATCACTGC 7500 

GACTTTTTTA CGTTTTGTAT TGTCATTCTT CGTGAAGTTA GAAACATTTA ATTCTAATAA 7560 

AGAAATAGAT GACGTTAAAG CCGCAAATAA GAACAGCACT AAGAATCCCA AATAGAATAA 7620 

TGTGCCTAGA TGCATTTGAC TAAAGACCAT TGGCAGTACT TTAAATAATA ATCCAGGCCC 7680 

TTCrtGTGGT TCATAGCCAA AACTATGTAA AGCCGGAAAT ATAGCTAGAC CTGCCAATAC 774 0 

40 AGATACAAAG ATATTCATAA CAACGATAGA AATAGCTGAT GACTTAATCG TCATGTCTTT 7800 

AGAGGCATAA CTCGCATAAG TAATCATACC TGTAGTTCCT AATGATAACG TAAAGAATGA 786 0 

TTGACCTAGC GCAAACAAGA TGCCATCAGC AGTAATCTCT GATACTCTTG GTTGTAAAAT 7920 

AAATTTCACA CCTTCTAAGA CGCCATCTAA TGTTAAAGAC TTAATCACAA TGACGATTAA 7980 

AAAGACAAAC AGCAATGGCA TCATAACTTT CGATGCCTTT TCTAATCCTT TTTCAACACC 804 0 

TAACATGACA ATAATCATCG TAGCGAATAT GAATATACCT TGCCCTAGAA CGGTTAACCA 8100 

AGGATTTGAT ATTACCGCTT CAAAATTCAT TTCTTGGAGA TGATTGATGC GTTGAAATAT 8160 

AACTAATTGC CATAATACTT GTCCGATGTA AATGACAATC CAACCACCGA TAACACTATA 8220 
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TTTACCAGTT AATTTACTAT ATATTTGTGT TGTATATGTC CGTCCCATTT TCCCAACAGT 



8340 



GAATTCCATA ATGAGTAATG GCAACCCAAC AAAAATGGTG AATATTAAGA ACATAGCTAG 



8400 



AAAGGCACCG CCGCCATAAA TCCCTGCCAT ATATGGGAAT TTCCACATGG CACCAAGACC 



8460 



GATTGCAGAA CcCGCACTAG CTAAAATAAA TCCAGTTGAT GACTTCCATT GTGATTGTTG 



8520 



TCTTTTCATC ATTCAC 



8536 



70 



15 



20 



25 



30 



35 



40 



45 



50 



(2) INFORMATION FOR SEQ ID NO: 279: 

(i} SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4328 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 279: 

GCTTTGGCCA TTTTATGTGG CGATTGAGAC AATCtGTkGT TGTCTTATTT GATGTTGTAT 60 

TTCAACTGGT AATTCTAGTT GCGATTGAAA TAATGGCAAC TTTTCCCAAT CATTAACAAA 120 

TAATTCAATA CCTGCTATGT CTAATACTTT AGCACGTGCA TCATCAACAA GACGGCGTTC 180 

CAATTGATTT GCTTCTTCTT TAATACCTGG TGACGTACTT TCTAATATCA AATTAGATAT 240 

AGGGATGTGA CCATTAATTG CATAATATAA TGCAACACGC CCACCCATTG AATATCCAAA 300 

CAATGTTATT GATTTATCTT TATATTTATC TAAAATTCGG TCTAACAACG TCGTAATATA 3 60 

ATCAAAATTC CACGTTTCAT CCATTGAAGA CTGATCTTCG CCATGGCCTG GTAAGTCTAT 420 

AGTGATGACA TGATAGTTAT CAGTAAATTT TTCGATGTGA TTATGATAAG TACGGCTGTC 480 

GCTAAGAAAT CCATGCAGAA ATACTAAAAC TTGATTGGTC TCAACGTTTG CTTCATAAAA 540 

TTTOTAATGT GTCATGAATC ATTTCACTCA ATTTCTGGTA TAAAATTTGA TGCTGTTTAA 600 

AGTTATCTTC GCGATTCGTT ATCAATTCAT AAATCGTCGA AGTTTCAGAT AACAATGTGG 660 

CATTTTTAAA TTCTGAAACA CTGTTAAAAC GTTTAAAATC GAATTGATAT AACTTAGCTG 720 

TATACTCGAA ATCCAATCCC GTCGGTGTGC CAAACAACCG TTCAAAATAG TCAGTTGCAC 780 

TTTCTTTTTG TGGTAAATAT GAAAAAATAC CGCCACCATC GTTGTTCAAT AATACAATAT 840 

TCATCTGAAT ATTATTTAAT TTTGACATTA ATAGTCCATT CATATCATGA TAAAATGATA 900 

AATCACCTAT CAATAATGTT ATTCGTTTAT GCACAGCCAT ACCCAGTGCA GTTGAAACGA 960 

TACCATCAAT ACCATTCGCA CCACGATTCG CATAGACATC TATATTTTTA TTCAATAACA 1020 

AGTTATCTAC ATCTCTGATA GGCATACTAT TACTAATAAA TAATGCATCT TTTTCAGATG 1080 



1101 
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TAATTTCTTT ACGCCCTTTT TTCTCTAAGC ATTGCCATTT TTCTAACCAA CTTACGCGAT 1200 

TAACTGTCGT GTCTTCCATT AATGACCTAA AGAAATCATT CGCAGAAATC TCATATGAAA 1260 

TATCTGGCGC TATCGGAAAG ACATCAATCT TATCATTGTT TTGCACTAAT ATTTGAAATG 1320 

CATCAGTTTT CTTTAACCAT TGATTTAACT TTTTAGAAAT CACTGGTTTC CCAACACGAA 1380 

TTACGAAATC CACATTTAAG TCTAAGCCGC TTCTAAACAG CAAATCATAT GTACAGATAA 1440 

CATTCGGATG ATCAAATTTT CTTAAATGAC TTAAAGGATC AGCTAAAATA GGCAAATCAT 1500 

ATATCGTTGA ATACGTTAGT ATTTGaTCAA CTTCTTGGTG CTGCATATCC CCTACAATAA 1560 

15 TTAAACCTTT TTTCTTATTT AAAATGTGTC TTAATGCCGA TGCATCTATA CTTTTTTGAT 1620 

AGTGCGGTAA AATCTTCATC TCAGAAGTTA ACAATTCTGT TGCATTCAAA TCAGGTGTTA 1680 

ACGGATCTCT AAATGGCAAG TTAAAATGAA TTGGCCCTTT ATGTGGTCCA TATAAATATT 1740 

20 GACTAGCAAT TTGCATTTGA TAGTAAATTG CATCAATGGT CTCTTTACTA TCATCCGCAA 1800 

TAGGCATATC GAACTCATAA CTTACATAAT TATTAAACAT ATTTACTTGA TTAATCGCTT I860 

GTGGTGCGCC TACACTTCTT AATTCATGCG GACGGTCACT TGTTAAAACG ATTAAAGGAA 1920 

TTCTACTAAT TTGGCTTTCA GCAATTGCAG GCGTATAATT CGCTGCTGCT GTACCTGACG 1980 

TACATAATAT AGCGACAGGT CTTTCACTGC CTTTAATTAA CCCAACTGCA AAAAACGCTG 2040 

CACTTCGCTC ATCGGGGTGT ATCCATGTTT TAATATTTGG ATGTGCTTCA AATGCAAGTG 2100 

CAAGTGGCGT TGAGCGTGAT CCCGGACTGA TAACTACTTC CCTTACGCCG TACGCATATA 2160 

ACTCAGATGC AAATGTAAAA ACTTGCTTCG TTAAAGCTGC TTTATGATTT CCCATTCATA 2220 

35 TCGACTCCTA ATGCATTCAT CATAGGTGTG AACTTAAGGT TCGTTTCTGC CAATTCACTA 2280 

TCTGGATCAG AATCTTTAAC AATGCCACAC CCAGCAAATA AAGTTGCTTG TGCTTTCTTA 2340 

ATAAGCATCG AACGAATTGC AACAATAAAT TCACAATCAT CGTATATATC TATATAGCCA 2400 

ACCGGTGCAC CATATAATCC TCGCGTACCA AATTCTTTCT GCTCAATAAA ATCCATTGCA 2460 

AATTCTTTTG GATAGCCACC TAAAGCAGGT GTTGGATGTA AATTATCAAT TAAACTAATA 2520 

TACGAATCAT CCTTCAGTGG CGCCTTTATT TCAGTGTACA AGTGATATAA ATGATCATTT 2580 

TTTAGAATTT TAGGCGTCTT ATCATAATGT AATTCAGTGA TATAAGGTTT AATATCATGT 2640 

AAAATACTGT CAACAACAAA TCGATGTTCG ATTAAGTTTT TATTATCTTT TAAAAATGCT 2700 

TCAACATTTT TTGTATCTTC GTCCTCATCT TGTGAACGTT TAATTGTACC TGCTACAGCT 2760 

TTAGTCGATA GTATTTTATT ATTGACCTTT ATTAATTGTT CAGGTGTTTG TGAAAAGAAT 2820 

ATAGAATCTT GTGATTCTAA CAAGAATATA TAACTGTTTT TTTCTTTAGA ATATGCTTGC 2880 
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45 



SO 



55 



1102 



EP 0 786 519 A2 

ACAATTTTTT CTTCATTATT AATAGATTCT ATAGCTTCTA CTACAAGTTG ACGCCAGTCA 3000 

TCTTTATAAA TATCTTCATT TCTAGTAATT TCCCCAATTT GCTCGTCCAC ATCTATGTCC 3060 

5 GATATATTGT TGAACAAATC CATTAAATCG TTCAATGCCT CAACAGTAAA ACTTTCCCTT 3120 

TTAACTGTAT AAGTTAAAAA TGTCCCATTA TTATCAGTTG AAATTAAAAC TTCAGGTAAT 3180 

ACAAAATGAT TTAGTCCAAA CTCTCGCCAT TCATCATCTG ATTTATGACT TGAAAATTGG 324 0 

10 

AACCCTCCAA CAACTCGAAG ATGATGTTTC TCAGATTGCG GATGTATAAA TGTGATGTTA 3300 

TGTTTTAATT TTTCCCAGTC TTTAAAAATA GATTGTTTAT TTTTAGAATT ATTTTTGAAT 3360 

15 AATTGAATTG CTTTGTAGCC AAAATATGAC GTTCGATTAT CATTCAAACG CATATAAAAG 3420 

CGATCTCCTG CCTCATTGTC AGTGAGATGA AATAATGTGC TCGGGTCTAG TGACTGTGAT 3480 

AATTTCACTT CAACTGAAAC CCATTCCTTT GAGCTGCCAT ATATCTCTTT GACAATATCG 354 0 

20 TCCTCTAATA CGCCCGTAGC CATCCATTTC ACTTCTTTCT TCGTCTTTTT TCACTCATTA 3600 

TTATATTGTA TCATTTTTGG ATAATTGTGT TACAAGAATT GCTTAAACTT ATCTTGCAAT 3660 

TTTTCACGTC AATTGACCTT TATGCTACTT TCTATTAAAA TATCTTTGTT ATAAAAAATA 3720 

25 TGATTTAAAG AGGTTTTGTA TTCAATGAGT AATCAATATC AGCAATATTC TACAGTTAAG 3780 

AAATATTGGC ATTTAATGCG TCCTCATACA TTAACTGCTT CCGTAGTACC CGTTTTAGTT 3 84 0 

GGTACAGCAG CATCTAAAAT ATATTTTCTT GGTAGCGAAG ATCATATTAA AATCAGCCTA 3 900 

30 

TTCATTGCCA TGTTACTAGC ATGCTTACTT ATTCAAGCAG CAACTAATAT GTTTAATGAA 3 960 

TACTATGATT ATAAAAAAGG CCTCGATGAT CATGAATCTG TAGGCATTGG TGGTGCCATT 4020 

GTTCGCAACG GTATGAGCCC AGAGCTTGTG CTACGATTAG CCATTGCATT TTACATCTTA 4080 

35 

GCAGCAATAT TAGGTTTGTT TTTAGCTGCT AACTCTTCAT TTTGGTTATT ACCAGTTGGA 4140 

TTAGfATGTA TGGCTGTTGG TTACCTATAT ACAGGTGGCC CTTTCCCTAT TTCATGGACG 4200 

40 CCTTTCGGTG AATTATTCTC AGGCGTATTT ATGGGTATGT TTATTATCGT TATTGCATTC 4 260 

TTTATTCAAA CTGGCAATAT TCAAAGTTAT GTAATTTGGT TAAGTGTACC TATAGTAATC 4320 

ACTATCGG 4328 

45 (2) INFORMATION FOR SEQ ID NO: 280: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 1450 base pairs 

(B) TYPE: nucleic acid 
SO (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

55 



1103 



EP0 786 519 A2 



10 



GTTCAATACA GAAAAAATAA ATTTAGATGT TGAAGCATCC TACAATTAAT ACAGATCCAT 60 

TTCAATATAT TTAAACTAAA ATCTCGGGAT TTCTAAATTT TGAAATTTCG AGGTTTTnAT 120 

ATTTTTATTT AAAATAGCAC ATTTATACTT TATAATAGTA AAGATGAACA TATAAGGAGG 180 

CCAAATCATG GCAAAACATC CATTCGAACA ATTTAATCTA GAATCTAGTT TAATTGACGC 240 

TGTGAAAGAC CTTAATTTTG AAAAACCAAC TGAAATTCAG AATCGAATTA TTCCAAGAAT 300 

ACTAAAGAGA ACAAATTTAA TTGGTCAATC TCAAACGGGT ACAGGGAAAT CTCATGCATT 360 

TTTATTACCA TTAATGCAGT TAATTGATAG TGAAATAAAA GAACCACAAG CAATCGTAGT 420 

1S TGCACCAACA AGAGAACTTG CACAACAACT ATACGATGCA GCGAACCATT TAAGCCAATT 480 

TAAAGCTGGT GTTTCAGTTA AAGTTTTTAT TGGTGGTACA GATATAGAGA AAGATAGACA 540 

ACGTTGTAAT GCACAACCAC AATTGATTAT AGGCACCCCT ACTAGAATTA ATGACTTAGC 600 

20 TAAAACGGGA CATTTACATG TGCACTTAGC ATCATATTTA GTTATTGATG AAGCGGATCT 660 

TATGATTGAC TTAGGATTAA TTGAAGATGT AGATTACATT GCTGCAAGAT TGGAAGATAA 720 

TGCAAATATT GCGGTGTTTA GTGCTACAAT CCCACAACAG TTACAACCAT TTTTAAATAA 780 

ATATTTAAGT CATCCAGAAT ATGTAGCTGT CGACAGTAAA AAACAAAATA AAAAGAACAT 84 0 

CGAATTCTAT TTAATACCTA CTAAAGGTGC AGCTAAAGTT GAAAAGACTT TAAATTTAAT 900 

TGATATACTA AATCCATACT TATGTATTAT TTTCTGTAAT AGTAGAGATA ATGCAAATGA 960 

TTTAGCACGT TCACTAAATG AAGCTGGTAT TAAAGTTGGT ATGATTCATG GTGGCTTAAC 1020 

GCCaCGTgAA CGTAAACAAC AAATGarACG TATACGTAAT TTaGAATTCC aATACGTTAT 1080 

TGCCaGCGAT TTAGCATCTC GTGGTATTGA TATTGAAGGT GTTAGTCrTG TCATCaATTT 1140 

TGATGTGCCA AATGATATTG ACTTCTTTAC GCATAGAGTC GGACGAACTG GTCGTGGGAA 1200 

TTATTrAGGT GTAGCAATTA CGCTTTATAG TCCTGATGAA GAACACAATA TTTCATTAAT 1260 

40 AGAAGATCGC GGTTTTGTAT TCAATACTGT TGATATTAAA GATGGTGAGT TAAAAGAAGT 1320 

TAAAGCGCAC AATCAGCGTC AAGCAAGAAT GCGCAAAGAT GACCATTTAA CTAATCAAGT 1380 

GAAGAACAAA GTTCGAAGTA AAATTAAAAA CAAAGTTAAA CCAGGTTATA AGAAGAAATT 144 0 

45 TAAACAAGAA 

(2) INFORMATION FOR SEQ ID NO: 281: 

(i) SEQUENCE CHARACTERISTICS: 
so (h) LENGTH: 1139 base pairs 

(BJ TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

55 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 281: 

AGTCAGGTAT ATCATGCCaT yCTGAATTGG TCGATATTAA TATCAGTGGT GTTAAAGAAC 60 

5 

GAATTGTATA CCAATAGACG CTTTATATTG TAAAATAGTA TTAAATGCaG AATAGAGAGG 120 

AGATTTAATG CGATATGACA AATTATAAAG TTGTCGTTTT " AGATATGGAT GACACATTGC 180 

TAAATTCAGA TAATGTGATA TCAGAAGAAA CTGCAAATTA TTTAACAGCA ATTCAAGATG 240 

10 

AAGGTTATTA TGTTGTTCTA GCATCTGGTA GACCTACTGA AGGTATGATT CCAACTGCTA 300 

GAGATTTAAA ATTACCTGAA CATCATAGCT ATATTATTAG TTATAACGGT AGTAAAACGA 360 

r5 TTAACATGAC TAATGAAGAA GTAGAAGTAA GTAAATCGAT TGGTAAGCAA GATTTCGATG 420 

AAATTGTAGA TTATTGTCGA GATAGAGGCT TTTTCGTTCT TACATATCAT GATGGTCAAA 4 80 

TTATTTaCGA CAGCGAACAT GAGTATATGA ATATTGAAGC AGAATTAACA GGTTTACCGA 540 

20 TGAAACGTGT TGATGATATC AAAGCGTATA TTCAAGGCGA TGTACCCAAG GTCATGGGTG 600 

TAGATTATGT AGCGAATATT ACAGAAGCTA GAATTGATTT GAATGGTGTG TTCAATGATA 660 

ATGTAGATGC TACGACAAGT AAGCCATTCT TCTTAGAATT TATGGCCAAA GACGTTTCAA 720 

25 AAGGTAATGC AATTAAAGCG TTATGTCACA AATTGGGATA TTCGGTGGAT CAAGTCATTG 780 

CTTTTGGTGA TAGTATGAAT GATAAATCAA TGTTTGAAGT CGCAGGTCTA GCTATTGCTA 840 

TGGGGaATGC ATCAGATGAA CTTAAGCAAT ATGCAAATGA AGTTACGTTG GATCATAATG 900 

30 

AAAATGGTAT TCCACATGCG CTCAAAAAAT TGTTATAAAT TTTAAAATAA GCCTTAACAC 960 

ATGATATTTG AATAAGATAT CTTGTGGTTA AGGCTTTTTA TTTTTGTGAA AATGACTTCA 1020 

GTTATACTAT GGAGGATTTG AAATACATAT TTTAGATTAG TAATGATATC AAACGAATAG 1080 

35 

AGTAAATGTA TATTTttTGA ATAAATCAAG TATTAACTAG TCACGGAAGG nAGATAAAT 1139 
(2) INFORMATION FOR SEQ ID NO: 282: 

40 * (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2931 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

45 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 282: 
TCTAAAAATG CTGTGAAATT CTTTTATAAA TATCTAAAAG GAATTAATGT TGATAACATT 60 

SO 

GCTGTGATAG GAAGTAAGAC AGCGCAATAT TGTGAATCAC TTGGCATTCG AGTTGATTTT 120 
AtGCCAAACG ACTTTTCTCA AGAAGGATTT TTAAAATCAT TTAATCAAAC TAACCAAAAA 180 

65 
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20 



25 



30 



35 
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AATGAAGTTG 
GTTAAAGAAA 
GTACGTTATT 
GAACAAACAG 
ACACTCGAAT 
GACATAGAAG 
GAAAAGAAGA 
TTAAGTCATT 
AAGCTTATGA 
ATATAGGTAC 
AAAAAATGTA 
ATGGTCATTG 
CACTACTTGT 
GTAATATGAT 
ACAATATTCC 
GAGATGCAGC 
CTAACCGTTT 
TGATTGTTAA 
ATGTTCCAGT 
AAAATGGTTG 
CAGGTGCTGA 
AAGGTTTTAT 
GAAATCAGAA 
AGTACGCGCA 
AAAAATTTAT 
TATTTTAGGA 
TACAAGTTTT 
AGTACCTTCA 
TTTAAGATTA 



TTAAAATAGA 
TGATAGAACA 
ATTTTAATGA 
CACGGACCAT 
CACTAATTGA 
ATTGAGATCA 
TTTAATATAT 
GCCAGGTGTA 
CTTAGGCATA 
TGGTGCATAC 
TGATGACTTA 
TGGCGTGATT 
TAAAACAGCA 
GGATGGTTTT 
TATAATGAGT 
AGATTCAGCG 
GGAAGCACTT 
ACCTGCTCTA 
TGTTGCATAT 
GATAGATGAA 
TATGATTATT 
ATTTATGATT 
GAAGCAATGa 
TTTAAATCAG 
GATATCGATG 
CATAGAGACC 
GGTGCATCAA 
ATAGAAAAAG 
GCACGTGGTT 



TTTATATACT 
TCAACAAATC 
AGGATTTGTA 
TAAATCATAT 
AAAGATTTTA 
TCAGCGACAA 
CCAATTTTTG 
TACCAAATCA 
CGTGCCATTA 
ATTCACGATG 
TTAATTGTTG 
GATGACCATA 
ATTTCTCAAG 
GTTGCTGAAA 
TATGGTGTCA 
CCATCATTTG 
CGTGAATTAG 
AGTTATTTAG 
AATGTGAGTG 
GAACGTGTCG 
ACGTATTTTG 
TTCCATAAAC 
AGGTTGCTGA 
TAGATACACC 
GTAACGAGTA 
CTCAAGTTAT 
CATTACTTGA 
TGCGTATGGT 
ATACTGGCAG 



TCAGTGCCTA 
GATGCATTAA 
CCAAAATTCA 
CAACAACCAG 
GAAAGTAGGG 
TGAGAGATAT 
TAGTTGAAAA 
GTTTGAATTT 
TGTTTTTCGG 
GTGTTATTCA 
CAGACACTTG 
CACATGACGT 
TGGAAGCTGG 
TTCGTCGTGG 
AGTATGCATC 
GGGATAGAAA 
AAAGTGATCT 
ATATAGTTCG 
GAGAATATAG 
TTATGGAACA 
CAAAGGACAT 
TGTAGGAGGA 
AACTTTAATG 
AGCAATTTTT 
TATCGACTAT 
TAGTCATTTA 
AAATAAATTG 
GTCATCTGGT 
AAATAAAATT 



ACAAACAAAA 
CATTTTCAAG 
AGTCGTATTT 
TAACAATTGC 
GCTAAAAATG 
GGTTAGAGAG 
AGACGATGTG 
ACTTGAAAGT 
TGTTCCAAAC 
ACAGGCAACA 
TTTATGTGAA 
TGACAATGAT 
TGCTGATATT 
ATTAGATGAA 
AAGTTTCTTT 
AACGTATCAG 
TAAAGAAGGG 
AGATGTTAAA 
TATGACTAAA 
AATGGTTTCA 
TTGTCGCTAT 
ATTTACTTTA 
CCTGGTGGTG 
ATGGATCACG 
GTACTAAGTT 
CATGAAGCAA 
GCGCAgcTCG 
ACAGAAGCTA 
GTGAAATTTG 



TATACAAGAT 
TTCGTCGGCA 
TGCTATTGGA 
AGAAATTCAA 
AAATTTGATA 
AATCATGTAA 
AAAAAAGAAA 
GAATTAAAAG 
TCAAAaGATG 
CGTATTGCTA 
TATACTGATC 
AAATCATTGC 
ATTGCGCCAA 
GCCGGCTATT 
GGACCTTTTA 
ATGGACCCTG 
TGCGACATGA 
AATCATACGA 
GCAGCGGCAC 
ATGAAACGTG 
TTAGATAAAT 
TGAGATATAC 
TAAATAGTCC 
GTAAAGGTTC 
GGGGACCACT 
TTGATAAAGG 
TTATTGACCG 
CATTGGATAC 
AAGGTTGCTA 



300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
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oCCGGATTCT 


C CTGGTGTG C 


CTGAAGGTAT 


TGCTAAAAAT 


ACAATTACAG 


TTCCATACAA 


2100 


1 UATTTAGAT 


GCACTTAAAA 


TCGCTTTCGA 


AAAATTTGGa 


AACGATATTG 


CTGGTGTAAT 


2160 


CGTAGAACCT 


GTTGCTGGTA 


ATATGGGTGT 


CGTACCGCCG 


ATTGAAGGTT 


TTTTACAGGG 


2220 


ATTAAGAGAT 


ATTACGACTG 


AATACGGCGC 


ATTGCTAATT 


TTCGATGAAG 


TAATGACTGG 


2280 


TTTCAGAGTC 


GGTTATCATT 


GTGCACAAGG 


TTACTTTGGT 


GTGACACCAG 


ATTTAACTTG 


2340 


CTTAGGAAAA 


GTTATCGGTG 


GAGGACTACC 


TGTAGGTGCA 


TTTGGTGGTA 


AAAAAGAAAT 


2400 


CATGGATCAT 


ATAGCACCAT 


TAGGAAATAT 


TTATCAAGCG 


GGTACGTTAT 


CAGGAAATCC 


2460 


TCTTGCAATG 


ACAAGTGGTT 


ATGAAACGTT 


AAGCCAATTA ACGCCAGAGA 


CATATGAGTA 


2520 


TTTTAATATG 


TTAGGCGATA 


TACTTGAAGA 


CGGTTTAAAA 


CGTGTATTTG 


CTAAACACAA 


25B0 


TGTACCAATA 


ACTGTAAATA 


GAGCAGGTTC 


AATGATTGGT 


TATTTCTTAA 


ATGAAGGACC 


2640 


TGTAACTAAT 


TTTGAACAAG 


CGAATAAAAG 


TGATTTGAAA 


TTATTTGCAG 


AAATGTATCG 


2700 


AGAAATGGCA 


AAAGAAGGTG 


TGTTTTTACC 


ACCATCTCAA 


TTTGAAGGTA 


CATTCTTATC 


2760 


TACGGCACAC 


ACGAAAGAAG 


ATATTGAAAA 


AACGATTCAA 


GCATTTGATA 


CGGCTTTAAG 


2820 


TCGTATTGTA 


AAATAAATAT 


ACGGACAAAT 


TGAGAGCCTG 


AACTTTGTTC 


AGGCTCnTTT 


2880 


TAAATGTATA 


TAAGGCATGG 


GCGGCGACTT 


GATAGTGAAA 


GTCCACTACT 


A 


2931 



(2) INFORMATION FOR SEQ ID NO: 283: 

30 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1421 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 
35 {D) TOPOLOGY: linear 



r(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 283: 
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50 



AATTATGAAT 


GCATTACCAG 


TATTATTACA 


AAAGAACAAT TAAAAATGTT 


TGTTTATGAT 


60 


TATGATACGC 


ATCTCATTAA 


AAATGTAaTG 


GTTGCAGCAG ACGTGTTAAA 


GGCAAATGAT 


120 


ATTCAAGGAC 


ATGAACCATT 


AATCGTTAAC 


CTTCAAACGA TTGATGAAAC 


ATTACATCGT 


180 


TTACCTATGC ATAATAGAAA 


AGACATGATG 


GTTAATGGCG GTGTACTTAT 


GGCACATTTA 


240 


AATGCCAAAA GTGGTCCGTG GTTAAAAGAT 


GTGCTAAGAC AAATTGAGAT 


AGCGATTGTA 


300 


ACAGGTAAAG 


TAAGCAACGA 


AGAAACTGAA 


ATTTTGAAAT GGGTGGATAA 


TCATGTCAAA 


360 


ATATAGTCAA 


GATGTACTTC 


AATTACTCTA 


TAAAAATAAA CCGAATTATA 


TATCTGGACA 


420 


AAGCATTGCG 


GAATCACTTA 


ATATTTCACG 


CACTGCAGTA AAAAAAGTGA 


TTGACCAATT 


480 
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CCCAGATATT TGGTATCAAG GTATAATAGA CCAATATACA AAAAGTTCTG CTTTGTTTGA 
TTTTAGTGAA GTATACGATT CAATAGATTC TACACAACTT GCTGCGAAAA AGTCACTTGT 
TGGAAATCAA TCTTCATTTT TTATCTTGAG TGATGAACAA ACGAAAGGTC GTGGGCGATT 
TAATAGACAT TGGAGTTCTT CAAAAGGGCA AGGACTTTGG ATGTCTGTCG TGTTAAGACC 
TAACGTTGCA TTCTCAATGA TATCTAAATT TAATTTATTT ATTGCATTAG GGATAAGAGA 
TGCGATTCAA CATTTTAGTC AAGATGAAGT CAAAGTGAAA TGGCCGAATG ATATATTTAT 
TGATAATGGT AAAGTGTGTG GTTTCTTAAC TGAAATGGTT GCTAATAATG ATGGTATAGA 
AGCAATAATA TGTGGTATAG GTATTAATTT GACGCAACAA CTAGAAAACT TTGATGAAAG 
TATTAGACAT AGAGCAACAA GTATACAATT ACATGATAAA AATAAATTAG ATAGATATCA 
ATTTTTAGAG ATATTACTTC AAGAAATTGA AAAAAGATAT AATCAATTTT TAACGTTACC 
TTTTTCTGAA ATTCGTGAAG AATATACTGC AGCTTCTAAT ATTTGGAATA GAACGTTGCt 
ATTTACAGAA AATGATAAAC AGTTTAAAgG ACAAGCAATT GATTTAGATT ACGATGGCTA 1260 
TCTAATTGTT AGAGATGAAG CGGGTGAATC ACACCGTTTA ATTAGTGCAG ATATAGATTT 1320 
TTAACACTAA AGCAAGGAGA GATAGCTATG GGTATGGCAA CCTATGCCGT TGTGGATTTG 
GnAACAACAG GCAACCAATT AGATTTTGAC GATATCATTC A 
50 (2) INFORMATION FOR SEQ ID NO: 284: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 2202 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
35 (D) TOPOLOGY: linear 



25 



600 
660 
720 
7B0 
640 
900 
960 
1020 
1080 
1140 
1200 



1380 
1421 



SO 



55 



SEQUENCE DESCRIPTION: SEQ ID NO: 284: 
CCAAGTTGCC TAAAATGATT AAGCAAGGTT TATACCCTAT GCnAACGATT GAACAAGAAT 60 
CTGGAGCCAT CCGACTGCCA ACGATTTCTA GAGTGAnGCG TTCATTACAA TGGGGTAATG 120 
ATGCTTATAC AATGATTTTA GATCGTATGA ATATTGAAAC AAATGAATAA TAAATGAACG 180 
ATAAACAATG GTTATCTATC TGCACTAATA AGGTAGATAA TCATTGTTTT TTCACGAAAA 240 
AATTTACAGA GTAAAAGAAC TTAAATTTCA TATTAAGTCT TTAGAACTCG ACACTTAAAA 300 
ATGCTATAAT CATATGTATG TTAAAAAAGG AGTTTCGGAA AATGTATGAC ATTAAAAAAT 
GGCGCCATAT TTTTAAATTA GACCCAGCTA AACATATTTC AGATGATGAT TTAGATGCGA 
TTTGTATGTC TCAAACAGAT GCAATTATGA TTGGTGGAaC TGATGACGTT ACTGAAGATA 



40 
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CAAACATCGA 


AAGTGTAATG 


CCTGGTTTTG 


ATTtTTATTT 


TGTACCTACA GTACTGAACA 


600 




GTACAGATGT 


TGTATTTCAC 


AATGGTACAT 


TATTAGAAGC 


GCTTAAAACA 


TATGGACATA 


660 


5 


GTATAGATTT 


TGAGGAAGTA 


ATATTTGAAG 


GGTATGTCGT 


GTGCAATGCT 


GATAGCAAAG 


720 




TGGCAAAACA 


TACCAAAGCA 


AATACAGATT 


TAACAACAGA 


AGATTTAGAA GCATATGCCC 


780 


10 


AAATGGTCAA 


TCATATGTAT 


CGATTACCGG 


TTATGTATAT 


AGAGTATAGT 


GGCATTTATG 


840 




GCGACGTATC 


AAAGGTTCAA 


GCTGTCTCAG 


AACATCTAAC 


AGAAACGCAA 


CTTTTTTATG 


900 




GTGGCGGTAT 


TTCCTCAGAA 


CAACAAGCGA 


CAGAGATGGC 


AGCTATTGCA GATACAATTA 


960 


15 


TCGTCGGTGA 


TATTATTTAT 


AAAGATATTA AAAAAGCTTT 


AAAAACAGTA AAAATAAAGG 


1020 




AGTCTAGTAA 


ATGAATGCGT 


TATTAAATCA 


TATGAATACA 


GAGCAAAGTG 


AAGCTGTAAA 


1080 




GACAACAGAA 


GGACCATTGT 


TAATTATGGC 


AGGTGCTGGT 


TCAGGGAAGA 


CACGTGTTTT 


1140 


20 


AACACATAGA 


ATTGCTTATT 


TATTAGACGA 


AAAAGATGTC 


TCACCATACA 


ATGTTTTGGC 


1200 




TATTACTTTT 


ACAAATAAAG 


CTGCAAGAGA 


AATGAAAGAA 


CGTGTTCAAA AATTAGTAGG 


1260 


25 


TGATCAAGCA 


GAAGTTATTT 


GGATGTCAAC 


ATTCCACTCA 


ATGTGTGTTC 


GTATTTTACG 


1320 


TCGTGATGCA 


GATCGAATTG 


GTATAGAACG 


CAATTTTACG 


ATAATTGATC 


CTACAGACCA 


1380 




AAAATCTGTT 


ATTAAAGACG 


TCTTAAAAAA 


TGAAAATATT 


GATAGTAAAA 


AGTTTGAACC 


1440 


30 


TCGTATGTTT 


ATCGGTGCGA 


TCAGTAATTT 


GAAAAATGAA 


CTTAAAACAC 


CTGCAGATGC 


1500 




TCAAAAAGAA GCCACAGATT aTCACTCgcA AwTGGTaGCA 


ACgGTTTaTA GTgGATATCA 


1560 




ACGCCAATTG 


TCAOGTAATG 


AAGCGTTAGA 


TTTTGATGAC 


CTTATTATGA 


CAACGATTAA 


1620 


35 


CTTATTTGAG 


CGTGTACCAG 


AAGTTCTAGA 


ATATTATCAG 


AACAAATTCC 


AATATATTCA 


1680 




TGTAGATGAG 


TATCAAGATA 


CTAATAAAGC 


ACAATACACA 


TTAGTTAAAT 


TATTAGCAAG 


1740 


40 


TAAGTTTAAA AACTTATGTG 


TTGTAGGTGA 


CTCAGATCAG 


TCAATTTATG 


GTTGGCGTGG 


1800 


TGCTGATATT 


CAAAATATCT 


TATCATTTGA 


AAAAGACTAT 


CCAGAAGCGA 


ATACAATCTT 


1860 




TTTAGAGCAA 


AATTATCGTT 


CGACGAAAAC 


GATTTTAAAT 


GCGGCTAACG 


AAGTGrTTAA 


1920 


45 


AAATAATTCT 


GAACGTAAGC 


CAAAAGGACT 


GTGGACTGCA 


AATACGAATG 


GTGAGAAAAT 


1980 




TCATTACTAT 


GAAGCAATGA 


CGGAACtGAT 


GAAGCGGAAT 


TTGTAATACG 


AGAAATTATG 


2040 




AAGCATCAAC 


GTAATGGTAA 


GAAATATCAA 


GATATGGCAA 


TTTTATATAG 


AACGAATGCA 


2100 


50 


CAATCACGTG 


TACTTGAGGA 


AACATTCATG 


AAATCTAATA 


TGCCATACAC 


AATGGTTGGT 


2160 




GGCCAAAAGT 


TCTATGACCG 


TAAAGnAATC 


CAAAGATTTA 


TT 




2202 



(2) INFORMATION FOR SEQ ID NO: 285: 

55 
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(A) LENGTH: 785 base pairs 

(B) TYPE : nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 285: 
AGTGGTGCAA AGATAGGCAT TGATaATACC GCTAAGCCAG CAAGATGATG GCACGATAAA 
ACCTAAACAG AAGAAmATAA ATAGTAATAC GATGATAAAT AATGGTCCAC TCATATGTTG 
AACTAAAGAT GATGAAAAGT GTAAGATTGT ATCTGAAATC ATACCTTCAT TCAACACTAA 
ATTAATACCT CGAGCTAAAC CAATAATTAA AGATACACCT ACTAAACTTG ATGCACCATT 
GACAAATGCA TCTACAGTTC CTTTTTCTCC CAATCCAGAT TTACCTGTCC CAGCAATAAA 
CATTATTATA ATTGTAAATA TTAAAAATGC TGAAGCCATA ACTGGGAACC ACCAACCTTG 
CGTCATAACT CCCCATACCA TAATTGGAAA TGGTAGTACA AATAATGTAA GGATTATCTT 
CTTACGCAAA GTAAAATGGG CACTATCGTC ATCTTTTAAT ACAGACCATT GCTGTTCAAA 
AGCATCTTTG TCTTCATAAG AATATGACGC TTTAGGATCG TTTTTAATTT TTTTACAGTA 
CCAATATAAA TAACTAATAA CAAAAATCGC ACCGACAATA CAAGCACCTA TTCTCCAATA 
CAAGCCATCC GTAAAAGTTG TACCAGCGGC ATTAGAGGCA ATTACAACCG AGAACGGGTT 
AATAGTTGAA AATGTACTAC CGACAGAGCT GGcAAGGAAT ATGGCACCAA CTGGAAACGA 
TAGAATCGTA TCCTAACGCT AATAAATATA GGGACTAAAA TCGGATAAAA TGCTACAGCT 
TCTTC 

(2) INFORMATION FOR SEQ ID NO: 286: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 812 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 286: 
CTAACGnGAT AAGGTTGCAA nTTTATCTGA ACATCTGATG ACTGTAATTT TGTtAATGAT 
AAAATATTTG TCACTAATAG ATATAAATAC TGACTTTCTT GAAAACTATG TACAAGTAAT 
TGTTCCTTTT CTATGATAGA CATATCTTTA CTATGTGATA CTAAAATATC TAAATkTCCC 
ATAATTGTTG TTAACGGTGT ACGTATGTCA TGCGAAATTG ATCTTAAAAA ATTTGAATGT 
GTCAGTTGAC GTTCAGCCTG TAACATGGAT TCTCTCGTTT GTTTAAGTAA CGTCACATTT 
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ATCACTTGAG AACTTTGGTA ATCAATGGCT AGAATGCCTT TAATCGGAGA TGTGCCAATT 420 

GGTATCAACC ATTTATTAAT GCCTGGAAAT GTATCTGTTG TTGCACCAGC TTGTCTTTCA 4 80 

TTTTTAATTA CCCAGCTTAA TGCTTGTTCA TGCTGTTGAG TCGTATTATC GATATGGTTT 540 

TGCAATGGTA TTGTTTTAAT TACTTTCGAT TGATTGATAA CGTATATAGT AATTGATTGT 600 

TGCAATAATT GATTAATTTG GTATCCAGCA TTTATTAGTA AGTTTTCAAC TGTATAAGTT 660 

TGTTTAATCG AATCATTAAA TTGAAATAAT AAATCTGTAC GATAAAGTTG CTTTTTAGTA 720 

ATGGaGTAwT GGAATTTAAT TTGTnTTAAT AAAGCACTCG TTAAAATACT TGTnAAAATG 780 

CTAACGATAA ATGTAATAGG ATAGTCAAAG CG 812 
(2) INFORMATION FOR SEQ ID NO: 287: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1732 base pairs 
20 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



25 (Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 287: 

ATnnATTATT ATTACTGCTA TTTTAAATTT TAAAAAATGC TTTTGATTAT ATTCAACAnT 60 

TTGTATAAAA TTAAATTTGC TTTTGATTAA AGCATGAAAA TTGTAATCAA ACCATAAATT 120 

30 

GTCGTATGAT GTAGTTAGAA TTTTAAAATG CAGGAGGTCa AGTATATGAC TGAAATaACA 180 

TTCAAAGGTG GACCAATCCA CTTAAAAGGT CAACAAATTA ATGAAGGTGA TTTTGCACCT 240 

GATTTTACAG TGTTAGATAA TGACTTAAAT CAAGTAACAT TAGCAGATTA TGCTGGTAAA 300 

35 

AAGAAATTAA TTAgTGTGGT ACCATCAATT GATACAGGTG TTTGTGATCA GCAGACTCGC 360 

AAATTCAACT CTGATGCTTC TAAAGAAGAG GGGATTGTGC TTACAATTTC AGCAGACTTA 420 

40 CCATTCGCAC AAAAAAGATG GTGCGCTTCA GCAGGTTTAG ACAATGTCAT TACATTAAGT 480 

GACCACCGTG ACTTATCATT TGGTGAAAAC TATGGCGTTG TTATGGAAGA ACTTCGCTTA 540 

TTAGCTCGTG CAGTATTTGT ATTAGATGCA GATAATAAAG TTGTTTATAA AGAAATCGTT 600 

AGTGAAGGTA CTGATTTCCC AGATTTTGAT GCTGCTTTAG CTGCATACAA AAATATTTAA 660 

TCATTAAAGA GATAAATCTT AAAATGTATA CATCGTGTCC ATCGTTGTCA ACAGCATTAA 720 

AATAGAATTG TTTTCTATGA TTGCTAAGAC CTATGGGCAC TTTTTATTGG AGAGGGACGA 780 

ATATGGCAGA ACAACAAACA ATTATGGAAC GCTTGTTTCA TACATTAGAT GAAAAAGCTA 840 

AAACATTAAA TAATGAAAAT GGCCaAAGTT TTATTGAAAA TCTTGGGCTA GCAATGGAAC 900 
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CATTCCAATT TGCATATTTA AGTTTAATGC a GG AAGAAAA GATAcAAGCA AATCATCAAA 
TTACACCAGA TTCAATTGGA TTGATACTAG GATTTTTAGT TGAGCGTTTT ATGAACAACC 
AAGAAGAATT ACATATTGTT GATATTGCAA GTGGTGCCGG TCATTTAAGT GCTACTGTAA 
AAGAAGTGTT ACCTGraAtT GcGGTTATGc ATcATTTaAT TGaAGTTGAt CCAGTTTTAT 
CACGTGTTAG TGTACATTTA GCAAACTTCT TAGAAATTCC TTTCGATGTG TATCCTCAAG 
ATGCCATCAT GCCACTACCA TTAGAAGAAG CAGATATCGT TATTGGTGAT TTTCCAGTAG 
GCTATTATCC AATTGATGAA AGAAGTAAGG AGTTTAAGCT AGGTTTTGAA GAAGGACATA 
GTTATTCACA TTATTTATTA ATAGAACAAG CAATAAATGC ATTAAAAGAT GCTGGATATG 
CCTTTCTAGT GGTACCAAGT AATATTTTTA CAGGTGAACA TGTAAAACAG CTTGAAAAAT 
ATATTGCAAC AGAGACAGAG ATGCAAGCAT TTTTAAATTT ACCACCAACT TTATTTAAAA 
ATGAAAAAGC GCGAAAATCT ATATTAATTT TACAAAAGAA AAAATCGGGT GaAACAAAGC 
CAGTTGAAGT ATTATTGGCA AATATTCCTg ATTTCcAAAA TTCCTTCACC AATTTCCAAG 
GATTTATGGA CAGAGTTAAA ATCCAGTGGG ATGGGACCAC CAAATCGTCC TA 
(2) INFORMATION FOR SEQ ID NO: 288: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2779 base pairs 

(B) TYPE : nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 288: 
AAAAGAACTA GCTAAACGCA AGCAAGAAGC TATTAGTAGA ATTAAAGACT TTTCAAATGA 
AAAAATAAAT AGTATTCGAA ATAGTGAAAT TGGCACAGCT GATGAAAAAC AAGCAGCAAT 
GAATCAAATT AACGAAATTG TGCTTGAAAC AATTAGAGAT ATTAATAATG CGCATACATT 
ACAGCAAGTT GAGGCTGCAT TGAACAATGG TATTGCTCGA ATTTCAGCAG TACAAATTGT 
AACATCTGAT CGTGCTAAAC AATCGTCAAG TACTGGAAAT GAATCTAATA GCCATTTAAC 
AATTGGTTAT GGAACTGCAA ATCATCCATT TAACAGTTCG ACTATTGGAC ATAAAAAGAA 
ACTTGATGAA GATGATGACA TTGATCCACT TCATATGCGT CACTTTAGTA ATAATTTCGG 
TAATGTTATT AAAAACGCTA TTGGTGTGGT GGGTATCTCT GGTTTACTAG CTAGTTTCTG 
GTTCTTCATT GCCAAACGTC GTCGTAAAGA AGATGAAGAG GAAGAATTAG AAATAAGAGA 
TAATAATAAA GATTCAATAA AAGAGACTTT AGACGATACA AAACATTTAC CACTTTTATT 
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AAATAATGGC 
TCGTAAAGAA 
GAAAGATAAC 
TGTTGAAACA 
AAAGAAAAAT 
TAAAAAGGTA 
TTCTTTGATA 
TTCTTTTTAA 
TCTCTCGGTA 
TCAAAATAAG 
AGCTTTGAGT 
GCATAAATAC 
TATGTATAAT 
cCTTTCGTCG 
TTAGTTAAAG 
CATCACTTAA 
TACGTAtACT 
TTCTATGCTC 
AGCTTTTTTC 
GGCAATGCGA 
AATGTGCaAG 
AATGCAAGTT 
CCCTTAAAAC 
TCTTACCTTT 
AAGCTAATTT 
TTCCGATAAA 
TACCATATGg 
AAGATAAATA 
CGTGGCACAA 



GAGTCACTCG 
GATGAAGAAG 
GAACATTCAC 
ACAACTAGTA 
CAAAAAGATA 
GCAGCTAAAA 
AATAGaGGAG 
TTAATTTATA 
TCCATTTAAC 
GTTTGAAATT 
CTGTATATAA 
ATGCAGCCCA 
GCTGCTCATC 
CAGCATCAAA 
TTACTATTAC 
ATAAGTAACA 
GTaATATACT 
TACGATGTTA 
AATTCTAGTC 
GTTGGGGTGT 
TTTGGGATGG 
GGGGTGGGAC 
TTATTCTTTT 
ACGATAAAAT 
TAATACGTAC 
TGCGATAGCT 
CACGGATGAA 
CATCAATATG 
CATCAAAGAT 



ATAAAGTTAA 
ATGTGGAAGT 
CACTCTTATT 
TTGAATCTAA 
ACCAATCCAA 
AGAAGAAAAA 
CACCGATTGA 
CAATGCCTGT 
AAATAATAAA 
TGCGTTTTTC 
TAGTGCGTTT 
TTCTGCAGTG 
TTCTTTGATT 
ATTTATTTTC 
TGTAATACAA 
CGTGTTTAAA 
TCCTAAAAAA 
TATTGGCAGT 
AGGGGCCCCA 
GGGTCCCAAC 
GCCCCAACAA 
GACGAAATAA 
GTGTAGTAAG 
GATTTAGCAA 
GTTGTAATAA 
ACAAATAAAG 
AAACGTTTTa 
TTGACCAATA 
TGCGTGTAAT 



ACATACGCCG 
TACAAATGAA 
CGCAAAACGA 
AGATGAGGAC 
AGACAAAAAG 
GAAAGCTAAG 
CATCACATCA 
TGAGCGTGTT 
TCAAAATCTT 
ACATAACCAG 
TGAACATTTA 
TGGTTATCCA 
ACAATGGCAC 
GCCATAATAA 
AATATGTTGG 
ATACTCGCTG 
ATCATCTTCA 
AGTTGACTGA 
ACACAGAGAA 
ACAGAAGATG 
AGAGAAATTG 
ATTTTGCGAA 
TGCGTTAATA 
TATATCCAAA 
ATATTTCAAa 
CTGTATCAAT 
TCmGaACTAA 
ATATATGCGA 
GCTTTTTGTG 



TTCTTCTTAC 
AACACAGATG 
CGCAAAGATA 
GTTCCTTTAT 
TCAGCATCAA 
AAAAATAAAA 
GTCGGTGCTC 
GATTCGCTTC 
TTTCAAATAT 
CTTCAATGCT 
ATTCACGTGC 
TTTCGCCTAA 
ATGTACTTAT 
ACCTACTTTC 
GTAATCCATT 
ATTCAAAGAT 
GGCTGGGACA 
ACGAAAATGC 
TTTCGAAAAG 
ACGAAAAGTC 
GATTCCCAAT 
AATATTATTT 
GCCTTGATCT 
TGGTACATTG 
TACAAmTGTa 
TATTGrGCTT 
ATACTTTTTT 
CGATTGAGCC 
CCATATCTTC 



CAAAACGTCG 

AAAAAGTGTT 

AAGAGGAAGA 

TATTGGCTAA 

AAAATACTTC 

AATAATTTGT ~ 

CTTTTATTTA 

TTTGTTTTGT 

TTCTATTTGA 

ATCTGCAATT 

ATGTTCTAGT 

CTCATGTGTA 

GCCTGGATTT 

TATTCAATAC 

AAAAAACACG 

GATTTTCTAA 

TAAATCAATG 

GCTTGTAACA 

AAATTCTACA 

AGCTTACAAT 

TTCTACAGAC 

CTGTCCCACT 

AACTTATCAA 

AAAACTGTTG 

CCAGGTAAAC 

AAAAATGTAC 

AATTAGTGAA 

TAAAGCAATG 

TGGTGCAGGA 



720 
780 
B4Q 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1360 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100. 
2160 
2220 
2280 
2340 
2400 
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CAAACTGCTC TTTTTGCAAC TCTACGCCCA TAAATATCGT TTAATATATC TGTTGCTAAA 
TAAATAGAAG CAAACATGAC ATTACCTAAA GTTGCTGAAA TACCAAAGAT TTCTACAGTT 
TTAATCACTT GTATGTTGGC AATGATTGTG CCAATTGCAA CCCATGCAAT TAAACCTTGT 
TTACCAAAAA AGCGATACAT AAGTACCATA AGCACGAACG TTGCAATAAA CGTAACTAGT 
CCTAAAATTT CATTATACAT ATTAAAATGT CCTGCTAAAT TTTGATCATG CGGGTGTTTA 
GAAACCGCTC AATAAATAA 
(2) INFORMATION FOR SEQ ID NO: 289: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1999 base pairs 

(B) TYPE: nucleic acid - 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

i 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 289: 
ACTGATGTGC GTTCATCAAA AACAATATAA TCAAATTCAT TTTCATCAAA TTGCTTAAAA 
TTATCATCTC TAGATAATGT TTGAATGGTT GCAAATAAAT ATTTGGCATC GACATCTCTA 
TGTTTTCCTG TCAACAATCC AAAATCACTA TCATTTTTTA TAGGTAATAC TTTTTTAAAT 
TCTTCCTTAG CTCTATTTAA AATCCCCTCA TTATGAACAA TAAATAAAAA TTTATTAGGG 
TTTACTTCTC TAACATCTAA TGCACATAAA ATCGTTTTAC CTGTACCAGT TGCAGATATT 
ATTAACGCCT TATCTTTGGC TTTATCCCTA ATAGCTTTTA ATGACCTTAA TGCTTCTGCT 
TGCATTAAAT TGGGTACAAT TTCCACTGAT TTTTTCACCT TATCAGCTAG CAGCATTTGA 
GTTTGTTCAA CCTCCGCTAA TTTTTCTAAG GAACGGTACT CAAATGATTC TTTATATGAA 
TTAATCCATT GCTCAGTCAG TGGGGTACTC TTTTGCCATA ACAAGTCAAA TTCACTTTTT 
ACACTATCAA CTAAATCGCC ATTTTTCATA GTAGACAGTA AAACATTATG CTCATAATTA 
ACCTTTAACG CATTAGATGT TAAATTAGAG CTTCCTATTA CCATAGAACT ATAATCCTTA 
TGCTCAAAAA TATATCCTTT GGCATGGAAT CCAGCAATAT CAGTTAATCT TACCTCTACA 
TTTTTTAATT TAAGTAATTC TCCATACATT TTAGGACTAT TAAACCCTAA GTAATTAGAT 
GTTAATATTT TCCCTTTAAC ACCCTTATTG CTTAAATCTA ATAGTTGAGC CTTTAAGCTG 
GcTAAACCGC TTTCTGTTAT AAAAGCCACA GAAAAATAAA ACGTTTCACA TTTTTGAAGT 
TCATCTATAA TTGTTGAAAG AACTTTTTCA TTTTTATTAT TTACTAAAAG CTTCGGTGTA 
TAATTCCCTT TATGAGAAAT ATGTTTGTCT ATAAACCCTT TATGTAAAGA TTGATTGAAA 
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CGCTGGGGCC CAATTTAATT TATCAAGTTC GTTTATTGAC AACCATTCAA TACTCTTATG 1140 

TTCAGTTAGA GTTGGTAACT CTTTGTTTAA AGTACATTTG TATGTTGTTA ACCTAACAAT 1200 

TCCAAAATCA TATTCATGTT CTGTAGTTAT AACTTTGTCT CCAACAATTA AATCACATTT 1260 

CATTTCTTCT CTAATTTCTC TAATCAAAGC GTCTTTTTCA GTTTCATTCT TTTCAACCTT 1320 

ACnGCCAGGA AATTCCCACA TTAAAGGCAG ACTCATTTTT TCACTTCTCT GTGCACAAAG 1380 

AATTTTGTTA TCAGAAAAAA TAATAGCTCC TACTACATTG ATTACTTTTT TCATAAGACT 1440 

CACCCTTCAA TTTAAAATCA TCTTAATTGT TATTCTATCA AAAATTACAA AACTATATAT 1500 

AAATCAATAT TAAAAATTAA TATTTTACAT TCACATGAAC GCTCTACTCC ATGCATTTTC 1560 

ATACACATCT ATTATATAAT ACTTGTGAAA AGTATTGTCT TGGGGCTGTG TTTTTTTACT 1620 

TTTGGGGCGT ATTTCTTTAT AATTCATTAC ATAAATGTAA GGGCTTTAGT TTTCATGTTT 1680 

20 TATTAAGTCT AACTGAGATT TTGAAAGGAT GTTTAGCAAC AATGGATAAA GAATTATGGA 1740 

TAGAACGAGC TAATGATAGT TTAGTTAAAC ATTTTTATGa GCAGCAATCT GACATTGAAC 1800 

AGCGAGAAGG TTTTGAAAGT AAATTAACAT TTGGTACTGC GGGTATACGC GGAAAATTCG 1860 

GTCTTGGTGA AGGTCGACTT AATAAGTTTA CTATTGAAAA ATTGGCATTA GGTTTAGCGC 1920 

GTTATTTAAA TGCCCAAACA AACAGTCCAA CAATAGTCAT TCATTATGAT ATTAGACATC 1980 

TTTCcAACTG AATTCGCCC 1999 
(2) INFORMATION FOR SEQ ID NO: 290:' 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1933 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS, : double 

(D) TOPOLOGY: linear 

40 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 290: 

GATGACTTTT CCCCCTCATA ATCTTCATGG TCCAGGCGTC CATTAATGCG TCAAAGGATG 60 

GCACATTTTA CCTGGAACAA ATGATTCATA TGGTTCATAA AAATCACGCG TCGTAATATA 120 

ATCTTCTAAA TCAAATGCAT AGAAAATCAT TGGCTTTTTA AATACTGCAT ATTCATATAT 180 

TAAAGATGAA TAGTCACTAA TTAATAAATC TGTTATGAAC AGTATATCAT TAACTTCTCT 240 

AAAGTCAGAA ACGTCAACAA AATATTGTTT ATGTTTGTCT GCAATATTAA GTCTATTTTT 300 

CACAAATGGA TGCATTTTAA ATAATACAAC CGCGTTATTT TTTTCGCAAT ATCTTGCTAA 360 

ACGTTCAAAA TCAATTTTGA AAAATGGGTA ATGTGCTGTA CCATGACCAC TACCTCTAAA 420 
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TTGTTTGATC 


TGTGTCGCAT 


AAGCTTCATC 


AAATAGTACA 


TCAGTACGTG 


GAACACCTGT 


540 




AGGCACTACA 


TTTTTCTCTT 


TAATACCAAA 


TGCTTCAGCG 


TAGAATGGAA 


TATCGGTTTC 


600 


5 


AGATGATACA 


TAAGCTTTTG 


TATAGCTACG 


ATGATTTAAT 


GAATCAATAA 


ATGGTCCACC 


660 




CTTTTTACCA 


GTACGACTAA 


AGCCAACTGT 


TTTAAAGGCA 


CCAACGGCAT 


GCCATACTTG 


720 


70 


AATAACTTCT 


TGAGAACGTC 


TAAAACGCAC 


TGTATAAATC AATGGGTGAA AGTCATCAAC 


780 


AAAGATGTAG 


TCTGCCTTCC 


CAAGTAAATA 


TGGCAATCTA AACTTGTCGA 


TGATGCCACG 


840 




TCTATCTGTA ATATTCGCTT 


TAAAAACAGT 


GTGAATATCA TACTTTTTAT 


CTAAATTTTG 


900 


75 


ACGTAACATT 


TCGTTATAGA 


TGTATTCAAA 


GTTTCCAGAC 


ATCGTTGGTC 


TAGAGTCTGA 


960 




TGTGAACAAC 


ACCGTATTCC 


CTTTTTTCAA 


GTGGAAAAAT 


TTCGTCGTAT 


TAAATATCGC 


1020 




TTTAAAAATA AATTGTCTTG 


TATTAAATGA 


TTGTTTGCGG AAATACTTAC 


GTAATTCTTT 


1080 


20 


ATATTTACGA 


ACGATATAAA 


TACTTTTAAC 


TTCCGGAGTC 


GTTACAACAA 


CATCAAGGAC 


1140 




AAATTCATTA 


ACATCGCTAG 


AAATTTCAGG 


TGTAACAGTA 


TAAACCGTTT 


TCTTCGAAAT 


1200 




GCCGCCTTTT 


CTAAATTCTT 


TTAGGTAAGT 


CTGCAATAAG 


AAATTGATTT 


TACCATTTTG 


1260 


25 


TGTTTCTAAT 


TCGTTGTATT 


CTTCTTCTTG 


TTCTGGCTTT 


AGATTTTGAT 


ATGCATCATT 


1320 




AATCACATCT 


GGGTTTAACT 


GTGCAATATA ATCAAGTTCT TGCTCATTCA 


CTAATAAGTA 


1380 


30 


CTTATCTTCA 


GGTAAGTAAT 


AACCATTATC 


TAAGATAGCT 


ACATTGAAAC 


GACAAACGAA 


1440 


• TTGATTCCCA 


TCTATTTTGA 


CATCATTCGC 


CTTCATTGTA 


CGTGTCTCAG 


TTAAATTTCT 


1500 




TAATACAAAA 


TTACTATCTT 


CTAAATCTAG 


GTTTTCACTA 


TGTCCTTCAA 


CGAATAACTG 


1560 


35 


AACACGTTCC 


CAATAGATTT 


TATCTATATA 


TATCTTACTT 


TTAACCAACG 


TTAATTCATC 


1620 




CTTTTCTATT 


TACATAATCC 


ATTTTAATAC 


TGTTTTACCC 


CAAGATGTAG 


ACAGGTCTGC 


1680 




TTCAAAAGCT TCTGTAAGAT 


CATTAATTGT 


TGCAATTTCA 


AATTCTTGAC 


CTTTTAACAA 


1740 


40 


CGCTAATTTA 


nCTACAATAT 


CTGGGTATTG 


AATGTATAAG 


TCTACAACAT 


CTTGGAAATC 


1800 




TTTTGAACCA 


CTTCGACTAC 


TACCAATCAA 


CGTTAGTCCT 


TTTTCCAATA 


CTAGACGTGT 


1860 




* ATTAACTTCT 


ACTGGGAACT 


CACTTACACC 


TAACAGTnCA ATGCTTCCTT 


CTGGTGAAAT 


1920 


45 


GTAATCGATC 


ATT 










1933 




(2) INFORMATION FOR SEQ ID NO: 291: 









(i) SEQUENCE CHARACTERISTICS: 
so (A) LENGTH: 2049 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: i 
nGTnCGGnCA GATATATTGG TGGTCTTTAG 

5 

GCATGTTATC ACCTCCTTAG GTTGATAACA 
GAACACAaGA TCAGAAGGAT TGCGTATAGG 
TTCTTCATCC TATTTAACGG AAAAGGAACG 

10 

TAAAAAAAGT GATTACAGCT ACTTAGAAAT 
ACTTCAATAC AGGGCGAATA ATAACAAACT 

15 GCCAAAAATC ATAATACCAC CAACACCAGA 
GAAAAAGTTA TACGCAACAC CTACACAAAT 
AGTATACAAC TGGTTGAAAT ATTACCGTGA 

20 TGATTATTCA GCAACGGGAA CATTGATTAA 
AAAGCATAAA AAATGGTATT AGGAGGATTA 
ATTAGCAGTG TTGTGCTTCA CGGTCTTAGC 

25 TACAGCATGG TCAATTGCAG GATTCGCAAG 
CTTTTATGAA GAATAAAAAA ACTGCTACTT 
ATTGTCTTAA ATAATTATAT AAGGAGTTAT 

30 

ACATTTTGCA ACATATGACA ATTTCAATTC 
TAAAACACAT GCAAAATCCA CACTTTCAAA 

35 AAGTTGGGGT GTCTGGCGTG TTATTGAATC 
AAAAGAAATT TTAGAAGAAC AATTTGAATT 
CCCTAGAGAA ATAGAAGAAC GTATCAAGTT 

40 AGGAGTTAAT CAATGGCAGT ATTAGAAGGT 
AACTTACGTG TGTTAAACAC TGAACTATCA 

GTTAAAGAAG CACCAATGCC AAAAGAAGAA 

45 

AAGGAAACTT CTGCTGATTT GACTAAAGAT 

AAAAAAGCAG ACACTTCTGA TAAGAAAGAA 

GATAAGCTAT CTACTATCAA AGAAGAGCAT 

SO 

AGAATAAATG CATGAAGCTA GATCACTCAA 
GAGCAAAACA ATGGCTAAAC TGTCCACCGA 

55 



3EQ ID NO: 291: 

TAAGTGTATC AAATTCATCA GATGTCAAGG 60 

aCATTATACa CGaAAGGAGC ATAAaCAAaT 120 

CGTCCCACAA GTTTCTAGCA AAGCTGATGC 180 

TAACTTAGGA GCGGAAATAT TAGAACTTAT 240 

AAACAAAGTT TTCTATGCAT TAGATAGAGA 300 

TTAaCATTTA TCTAAAGGAG TGATAGAGAT 360 

AAACACATAT CGAGGCGAAG AAAAATTTGT 420 

CCATCAATTG TTTGGAGTAT GTAGAAGTAC 480 

AGATAATTTA GGTGTAGAAA ATTTATACAT 540 

TATTTCTAAA TTAGAAGAGT ATTTGATCAG 600 

TCAAATGAGC GACACATATA AAAGCTACCT 660 

GATTGTACTC ATGCCATTGC TGTACTTCAC 720 

TATAGTGACA TTCATATTTT ATAAGGAATA 780 

GTTGGAGCAA GTAACAGTGC AAGATGAGCA 840 

TAATATGACC TTACAACAAA AAATACTATC 900 

TGATGATGTT GTTGAAACTT TTGGGATATC 960 

ACTTAAGAAA AAAGGAAAGA TTGCAATGGA 1020 

GCAATTGCAT TTAAGTGTAG TCGAACGTAA 1080 

GTTAGCAAGA TTAAATGAAC AAAGTGATGA 1140 

AATGATTCGT CTAGCTAACC AATTTTAAGG 1200 

ATTTTTGAAG AATTAAAACT ATTAAATAAG 1260 

ACTGTAGATT CATCAATTGT ACAAGAGAAA 1320 

ACAGCTCAAC TGGAATCAAT TGAAGAAGTT 1380 

TATGTTTTAT CAGTAGGAAA AGAGTTCCTT 1440 

TTTAGAAATA AACTTAACGA ACTTGGTGCG 1500 

TATGAAAAAA TTGTTGATTT TATGAATGCG' 1560 
ATAGAGCTCA TGCAAAGCTT AGTGCAAGTG " 1620 

GTATTAAGGC AAGTGAAGGT ATTGCAGATA 1680 
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GTCTTAAATA TGAAGGCCTA ACACAGTTTG AGTTTAATAA AGCTTTTCAA AATTATAAGC 1800 

GAAATCAATA TTACAGTGAA GAGTTGCGCG AATATGTTGa AGAGTACGTA GCTAATGTAG 1860 

AAGAAAAGTA TAACGAGGCT TTGaGTAGAG ATGACGATGT AATAGCTTTA TTTGAAACAA 1920 

AATTGGATyT AGGTAAATAC GTCCCTGAAT CTTTTGGTAy TGGTGATGTC AtTATATTTT 1980 

CAGGTGGTGT ACTTGAAATT ATTGACCTTA AATACGGTAA AGGCATTGAA GTTTCAGCTA 2040 

TAGATAATC 2049 
(2) INFORMATION FOR SEQ ID NO: 292: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 942 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 292: 

ATGATGTTTC TATATTCGTA TTAGGAAAAC CTGTTGGTAT TACAACAAAC GCCCTAAAAT 60 

TACAATACCG CTGCTCCTAT ACCAATTGCA ACAACAGTTT TAACTGAAAT ATCTTGTTTT 120 

TTCATCTTCA TTACTCCTtt ACATAAAAAA TTCATTATAT TGATGGTGCT TTAGATAAAT 180 

GAATCGTCCA ATCATTTCCA GTACCAATAT GATATAAATC TGAAAATGAG TCTTGATTGA 240 

CTGCTACACC AATATTTACT AGCGAGTTAA CATACACAAG AGGTTCACCC ACATTAACAT 300 

CTGCAAACGA TCGCGCAAAT TTAATAATAT TTTGATAGAC TTTCTTATCT TGATGATAAA 3 60 

TTGTTACCAC CAAATTATTA CCATGAACAA TTTCCAAGGA TTTTAAGAAT GCCAATGGAA 420 

TATTTGTCCA TAATGACCCA AATCTGATAT CTAAAATATC AATGCTTCCT GTAACAGAAT 4 80 

CCTC^TTTTT TGTCACTTCT CTTATTTCTA ATGCCTCAAT ACTATCAACA TTAATTGCCT 540 

40 GACCGAGACG TTCAAACGCT ATCTTATTTG CAGCTAATCT CGCACCATTG TATGCATAAA 600 

CATCTCTACC ATGAAAAGTA TGACTTTCTT CCGAATGAGG CAATCGGCTT TTCACTTCAT 660 

CAATTTCGAT AACTTTTTTA ATACCTTCGT AATGTTTAAT ATGACTTAAA GAACCATTAT 720 

CAGGTGTAAT AATGTAATGA CCTGAATATG TTAAGCAAGC AATGTCCGCC TATCACTACC 780 

TACACCCGGG TCTACCACTG ATACAAAraC TGTGCCTTTA GGCCAGTATT TTACAGTTTG 840 

ATATAAACGA TATGACGCTA CCCAAATGTC ATACGGTGGT ATATCATGCG TTAAGTTTTC 900 

AACACGTATA TCATCATTAC AGTATATGCA ACTCCATACA TT 942 
(2) INFORMATION FOR SEQ ID NO: 293: 
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(A) LENGTH: 1268 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY : linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 293: 

JO TGTAATAAAA TTTTATGnAA CATGCTGnGA TGCTACCATG AACCTTCTTC ATTTCTTTAT 60 

GTGAGATTGT GaAATTAATC AAATAATAAT ACGGTGGATA CTTTCCTAAT TTACGATATT 120 

CCATTTCCTG ACGATAAAAT GTTAAATAAT CATTTTTTTG AACATCCAAT ATTGAATAAT 180 

GATCTGGATT ATACGTTTGA ATGATGACTT GACCTGCCTT TTCATGACGA CCAGCTCTAC 24 0 

CAGCCACTTG CGTTAATAGT TGATAAGTAC GTTCGCTCGC CCGAAAATCA GGTAAATTTA 300 

ACATTGTATC TGCATTCAGC ACACCAACTA AAGTAATATT TGGATAATCT AATCCTTTCG 360 

CAATCATCTG AGTACCTAGT AAAATGTCAC CGTTACCTTT TTCGAATTCA GTCAATAACT 420 

TTTCATGTGC ACCTTTCTTT GAGGTTGTAT CTACATCCAT CCTAATTATG CGCGCATCTT 480 

CAAATTCTTG TTGCAATAGT TCTTCAACTT TCTGAGTACC AGTACCTACT TGTCGAATGT 54 0 

GTTCACTCTC ACAATTTGGA CATTGATTCG GTGGCGTCTC TTGGTAACCA CAATAGTGAC 600 

ATTTTAATAA GTCTGTCGTT TTATGATACG TTAATGAAAT ATCACAGTTT GGACATTGCG 660 

30 GTACATATCC ACAATCCCGA CATAACATAA ACGATGCATA ACCACGTCGA TTTAAAAATA 720 

AAACAACTTG TTCCTGTCGA TCTAATCTTA ATTGTATGGC TTCACGTAAA TCTTTTGAAA 780 

ACATTGACCG ATTACCTTCA CTCAATTCTT CACGCATGTC TACTATATCA ATTTCAGGTA 84 0 

35 AAGCTTGTTG GTTCACTCTG TTTGGTAATG ATAGCAAATG ATAAACGCCT TTTTCAGCTC 900 

GTGCATAACT TTCAAGACAT GGTGTTGCAC TTCCTAAAAT GACTGGACAG TGATGATATT 960 

CAc^CGCCA TTGGGCAATT TCTCTAGCGT GATATCTCGG ATAATCTTCT TGTTTATATG 1020 

TAGATTCATG TTCTTCATCA ATGATGATTA ACCCTAAATT TTTGAAAGGT GCGAACACAC 1080 

TTGACCTTGC ACCAACACTT ACTCTCGCAC GACCATCCCT AATTTTTTGC CATTCATCAT 1140 

AACGTTCCCC ATTAGATAAG CCAGAATGTA ATACAGCAAC GTCATCACCA AATCGACGTT 1200 

TGAAGCGTAA AACCATTTGC GGTGTTAGAG CGATTTCAGG AACTAACATC ATCGCCTGTT 1260 

TTCCTTGG 1268 
(2) INFORMATION FOR SEQ ID NO: 294: 



40 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 629 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 294: 

TACCACCAAA TAATATATTA GCTGGCATTT TAATAACATT TAnATTTGTC ATGATATCAT 60 

CAATAAAATG TTGAAACTTC GTAATTTCAC CTTCATAATC ATCAATTGCT GCTAATTGCG 120 

CACTCGATGC TTGCTGATCT AAATTTAAAA TATTCGACAT GCGTTGACTA TAATAAACTA 180 

AATGTTCTAT TAAGCCATCG TCACTCTTTT CCTTTGGTGC TGACATGACA GCGATACGTT 240 

TCAAAGGATA GTGTTGCGCC AATTTTAATG TCATTAATCC ACCTAAAGAC ACACCCGTTG 300 

CACTGATAGA TTCATAACCT TCATTGACTA AAAATTGGTA AGCTTTCTCA ACTTCTTCCC 360 

ACCAATCATC TACATTATAT GTCATGAAAT CTTTCAACAA TAAACCATGA CCTGGATAAT 420 

TCGGTGCATA ACAACTAAAT CCTTGGTCAT TTAACTCAGC TGCAAGATGC TTCACATCCC 480 

20 GATTTGTACC TGTAAATGAA TGTAATAATA ATATCGCATG TCCATTTGTG CCTTTTAAAT 54 0 

ACGtGGACTC GGTGTTTTAA TTCTCATTTT TCtaTATAcC TCCACTAtGT CTAAAGakGT 600 

TkGCTAAACG CGTTGtCGTC GATGATTAA 629 
25 (2) INFORMATION FOR SEQ ID NO: 295: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2817 base pairs 

(B) TYPE: nucleic acid 
3Q (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 295: 

TATGAAAGTA ATGAATGGTA ATATTATTAA ATTTGATGGA AAAGTAGATA TTGATAATGC 60 

AGATAATATC GGTTTTTTAA TTGAGCATCC TAAATTATAT GATAATAAAT CAGGATTGTA 120 

TAACTTGAAA TTATTTGCAC AAGTATTAGG TAAGGGTTTT GATAAAGCAT ACACAGACAA 180 

AATTATAGAT GCATTTGGTA TGAGACCTTA TATTAAAAAG AAAGTTAAGA AATATTCAAT 240 

GGGGATGAAG CAAAAGTTAG CAATTGCAGT ATCTTTArTG AATAAACCTA AATTTTTAAT 300 

45 CTTGGATGAG CCTACAAATG GkATGGATCC AGATGGCTCa ATTGATGTGC TGACTACAAT 360 

TAAGTCTTTA GkAAATGaAC TTGATATGAG AATTCtAATA TCAAGTCATA AGTTAGAAGA 420 

TATTGAATTA ATTTGTGATA GAGCTGTATT TTTAAGAGAC GGnCATTTTG TTCAAGATGT 480 

AAACATGGAG GAAGGTGTTG CATCTGACAC AACGATAGTT ACTGTTGATC ATAAAGACTT 540 

TGATAGAACT GAAAAATATC TTGCAGAGCA TTTCCAATTA CAAAATGTCG ACAAAGCAGA 600 
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ATTAGATATT TATCCGAAAT ATATTGAAAC ACGTAAAAGT TCATTGCGTG ATACGTACTT 720 

CAATATAAAT CAAAGAGGTG ATAAATAATG AGAATTTTAA ATTTAGTTAA GTATGATTTT 780 

TATAGTATAT TTAAaArTCC TTTAACATAT TTAGCGaTAC TAGTCGTATC TAGTTTGATT 840 

GCAACTCAAA GTATACTTAT GGCAAATTCG ATGGATAACC CGAAACATAT TATTGTCTAT 900 

GGATCTGTAT TTGCTGCAGC AAAATGGTTA TTGTTAATAA TTGGATTAAT GTTTGTTGTT 960 

AAGACAATTA CGCGTGATTT TTCACAAGGT ACAaTTCAAC TATATATGAG TAAAGTTAAA 1020 

ACACGCGTTG GAtACATTAT TTCGAAAACA ATTTCAATTa TTTTAATTTC AATATTATTT 1080 

GCATTAATTC ATTATGTGAT TTTGATTGTT GTGCAGGCAT CTAGTAATGG AAAAAATTTG 1140 

GCGTTTTCTA AATATGTAGA TAATTTATGG TTCTTCCTAA TCTTTTTACT ATTCTTTGGC 1200 

TTGTTTTTAT TCTTAATCAC ACTTGCATCA CAAAAAACAG CAATGATATT TTCATTAGGT 1260 

20 GTATTTTTAG TACTCATTGT ACCGTTTATT AAACCTTTTA TTACATTTAT CCCAAGATAC 1320 

GGTGAAAAAG TTTTAGATGC TTTTGATTAT ATCCCTTTTG CTTACTTAAC TGATAAAATG 1380 

ATTAGCTCTA ACTTTGATTT TAGCAATTGG CAATGGGTAA TTTCATTAGG TTCTATAGTG 1440 

ATATTCTTCA TTTTGAATAT CTTATATGTC GCTAAAAAAG ACATyTAATA AAAATAATTT 1500 

TGAGGTTGGG AATTTTAAAT TTTCCCAACC TCAAAGTTTG TCTTATTGTA AATTTATTTA 1560 

TTTTCTAATT TATTTAGGAT GGAATTATAA ACTGCTTTCC AAAATGAAGC GTCAGTTTTA 1620 

TAGCGGTTTG ATATAACTAA GTGTGTTTCT TTTTCTAAAT CTGCATAGTC TGGATGATCT 1680 

TTGCTCGGTA ATTTATCAGC ACGAACATCA GTTACAAATT TTTGGACTTC ATTTGCTCTT 1740 

GGTCCCCAAA CTGTTTCTTG TTCGAATTGA TCATTCAAGA ATACGAAGAT AGGAATTGCA 1800 

CGTGATTTAC CATTTGTTAA ATATTGATCG ATCAGTTTTG TATCATCATC TCTATGGAAC 1860 

ACGCGTACTT CTAAATTTAA TGCTTCACTG ATGTGTTTTA GAATTGGGAG ATTCATCATT 1920 

40 GCATCTCCAC ACCAGTCTTC AGTAATTACT AATACTTTAG AATAATTCAT CTCTTTTATT 1980 

TTTTTGATGC GTGAATCATC TTCTGGTAAC TCAAATGATT GATAGATACT GAGAACGGTA 2040 

TCTTGATTTG TCTTCATTCC ATCAATGTAT TCATTTAAGG GTTGGCTATT TTTGAAATAA 2100 

GTTTCTAAAT TTGTCATTGT AAAAACCTCC TTTAGCATTT ACAACATTAT ACCAATTTAT 2160 

AGTAATAAAA GGTAATGAAA TAAATTAATT GCAAATTCTT TGTTAATTTT TGTTAAGGAT 2220 

GAAACGGGAA GCACCTTATG CTATATTTAA ATAAGTACAA AGAAAGGGTG ACATCAGTGC 2280 

GTATTCAAAA TCGCTGGGTT GTGTTTATAT TATTTTTAAT CTGTTCTTTT GGTGTATTAA 2340 

TTGGTTTATA TCAATATCGT CATACGAAAA CTGTGGATTT GTCTAATCTT GAAATAAACG 2400 
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TTGATCGTTT TAAATTTTAT AACAGTAAAG CTCACCCTGA TCTTACCGTT AAAGTGAGAG 2520 

AAAAGGATAA CATCGTTAAG GGGATAATAT TAGTAAGAGA TGAAAAGATA CATACTAATT 2580 

TTGAtGGGGG AATTGGTTCG CCGATAAATA ACGCgATTGA AAATCTTGGa TTCgGATATA 2640 

AAAGrACaAA AGTTGGcAAT GrtTkCtCAT CgGTAAAGTA TATTGATAGA GATAACCATT 2700 

TAAAATTAAA CTTACTTTAT CAAGATTTAG AAATTAAACG TATTGAATTT TTTAGTAAAT 2760 

AGCTTTAGGT CTTAAAGTTw TAAAAAACGA ATGAaTAATT TTATTGGGAT GAGTGAC 2817 
(2) INFORMATION FOR SEQ ID NO: 296: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1607 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 296: 

TCTGTTAAAA TGATTTTTCT TTTAnAAAGG CCGnAAATCA ATGTTCGATT nTTATTTGCA 60 

TTATGGTCTC GATATTGGTA GAATATCAAA TGGTTAAATG AGAAAAACTT GGAGGTGCTC 120 

ACATGTCATC AATCGTAGTA GTTGGGACAC AATGGGGAGA CGAAGGAAAA GGAAAAATAA 180 

CGGATTTCTT GGcAGAACAG TCAGATGTTA TCGCGCGTTT TTCAGGTGGT AATAATGCAG 240 

GCCATACCAT TCAATTTGGC GGAGAAACAT ATAAATTACA TTTAGTACCA TCTGGTATCT 3 00 
TTTACAAAGA CAAATTAGCG GTAATCGGTA ACGGAGTCGT TGTTGATCCA GTTGCACTAT . 360 

TGAAAGAATT AGACGGATTA AATGAACGTG GCATTCCTAC AAGTAATTTA CGTATATCTA 420 
ATCGTGCGCA AGTGATTTTA CCATATCACT TAGCACAAGA TGAATATGAA GAACGTTTAC < 4 80 

gTGGtGACAA TAAGATTGGT ACAACTAAAA AAGGTATCGG TCCAGCATAT GTAGACAAAG 540 

TTCAACGTAT CGGTATTCGT ATGGCAGATT TACTTGAAAA AGAAACATTC GAAAGATTAT 600 

TAAAATCAAA CATTGAATAT AAACAAGCAT ATTTCAAAGG TATGTTTAAC GAAACATGTC 660 

CATCATTTGA TGATATCTTT GAAGAATATT ATGCAGCAGG TCAACGTCTA AAAGAATTTG 720 

45 TAACAGACAC ATCAAAAATC TTAGACGATG CATTTGTAGC AGATGAAAAG GTACTTTTCG 780 

AAGGTGCGCA AGGTGTAATG TTAGATATCG ACCATGGTAC ATATCCATTC GTTACATCAA 840 

GTAATCCAAT TGCAGGTAAC GTTACTGTTG GTACAGGTGT AGGTCCTACA TTCGTTTCAA 900 

AGGTAATTGG TGTATGTAAA GCTTATACAT CACGTGTTGG TGATGGTCCA TTCCCTACTG 960 

AATTATTCGA TGAAGATGGA CATCATATTA GAGAGGTTGG TCGTGAATAC GGTACAACAA 1020 
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TAAGTGGTAT TACAGATTTA TCTATTAACT CAATCGATGT TTTAACAGGC CTAGACACAG 1140 

TGAAAATCTG TACAGCTTAT GAATTAGACG GTAAAGAAAT TACTGAGTAC CCAGCAAACT 1200 

5 TAGATCAATT AAAACGTTGT AAACCAATCT TTGAAGAGTT ACCAGGTTGG ACAGAAGACG 1260 

TAACAAATGT GCGTACTTTA GAAGAATTAC CTGAAAATGC ACGTAAATAT TTAGAGCGTA 1320 

TTTCAGAATT ATGTAATGTA CAAATTTCTA TCTTCTCAGT TGGTCCAGAT AGAGAACAAA 1380 

10 

CAAACCTATT AAAAGAATTG TGGTAGAACT TTATATAAGT CATACACAAT GATTATAAAT 1440 

ACATGAGCCT TCTATCTTTA TTGGTAGGAG GCTTTTGTTA TGCTTGCTTC TGTATCGATT 1500 

CGATTATTTA GATAAAAAAT ACTAACGTAA AGGCGATATT TGCTAGTCAT AATTTAGAAG 1560 

15 

rTTAgATGAt AtTtAACGAA AAtTAAgATG anATACtTGA ATGGTAA 1607 
(2) INFORMATION FOR SEQ ID NO: 2 97: 

20 <i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3055 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

25 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 297: 

TTAGAAGTAA GCACTTTAAT ATCTTTACCT ACCCATGTAC CAACACCTTC TTTAGGCTTT 60 

30 

GGATTTTCAG CATGGTTATT TGATTTATTC ACCTGTTCAG ATCTATTTAC TTTATTACCT 120 

TTATTCGGGT TCTCTAATAC ATCAAATTTT AATCTCGGTG AATAAAAAAG ATATATTAAA 180 

AATCCAACTA AAAATAATAC ACCGACGACT CTTATAATTA ACTTTTTCAT CAATCAACCA 240 

35 

CCTAAAAAGT ATTAATACTA TTGTAAAAAA CAACACATTA ATTAGCAAAT TTTCAACACT 300 

GACATAACTG TGTCGTTTCG ATAAAACAAA ATCATCTTCA GGCATAATTT TAACGTCATA 3 60 

AAGATTTTCC CTACACTCTA TATCATAACC TATCTTTATG TTTTCAGGTT GAATTTCATT 420 

40 

ATTAAGATTA AAATATGTAT AAAAAAATGG ACAGTTAAGG TATCAAATGA ATACCATCAA 480 

. CTGTCCGACT ATTCTTCATC AAAAAACCTG ATAAAACAAA TTGCCTTATC AGATTAGTAT 540 

45 CATTTGTATA AG CAT ATT AA TGACCAAATG TTGCTTTAAT CAGTGATGTC GTTTCTCCAC 600 

CTGGATATAA TACATATAAT AATAAGTAAA CTGCTACACC TGTAATTGCA GTACAGAACC 660 

ATATAACTGA AGCGAATGGC CCGAATTTGC GGTGTACATT ATATTTATCT TTAAATGCAG 720 

50 TAATAATTTG AACTAGGCCT AGAATACCAC CAATTGTTGC TAAATTAATG TGGAAAAATA 780 

AGAAAATCGT ATAATATTTC TTAATTGATG CTGGTCCGCC AAATGCTGTA TTACCGATAA 840 
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TAACATTTTT GTGTTTATTT ATTTCCCTTT TCCAAATAAG TCTCCAACCA ATGGCAATTA . 960 

AAATTGCACT AATGACAATA CATGTCGTAC TAATCGTTGG TAAAATTGGA ACGCCCATAT 1020 

5 

TTTTCATCCT AACTTAATTA ATCTAGATCA AAGTAAGTAA TGAAACAATC ACAGCTAACA 1080 

CGAAAAAGAT CACTAAATAA TTTAGTGAAT ATATAAACAT TTGTGTTGCC CATTTTGTTT 1140 

GATCTGAATT TTTCTTAAAT GTTGTTAAAC CTAATGCAAT CCATCCTAAA TTTAATAAGG 1200 

TrGCTAACAC TaCGAATACG ACACCTAAAT TTATTAGTAA TAAAGGTACT GGCAATAAAA 1260 

TAATCAACCA GATAAACATA CTGACACGTG TACGTTTAAA GCCCTTAACT GATGGTAACA 1320 

1S TTGGAATATT TGCAAGTGCA TATTCATCTT TACGTTTAAT AGCTAAGGcA TAAAAATGAA 1380 

TTGGtTGCCA ACmAAATACA ACTAAAAACA GCGCAATCGC TGTTAAACTA ATTTGTCCTT 1440 

CAATTGCAAC CCATCCAATT AGTGGTGGTA CTGCTCCAGG AAAACTCCCA ATCACTGTGT 1500" 

20 TCCATGTTGT ATGTCTTTTA GACCATATTG AGTAATAAGA CACATAACCT ACAATCCCCA 1560 

TAAGACCAAG TACGCCTGAT GGTATATTCA ATAAAAACAA ACAAATTTCT CCAACTAACA 1620 

TCATACCAAA ACTTAATAGT AATAAATTTT GATCTGTAAT TCTATTATTT ACAGTTGGTC 1680 

25 TATTTTGTTT ACTAGGCATA ATACGATCAA TATCTTGGTC GTAATAATTA TTTAACGCAC 174 0 

ATGCGCCACC CATAATTAAA GTAGATCCAA ATAGCATTAA TAAAATTTGA GGTATTGATG 1800 

ATAAGAAGGA ATGATTTGTC ATTACAACTG CTAGCCATGC GCcCGCAAAA GCCGGAATTA 1860 

30 

AGTTACCTTG AACAAGTCCC ATTTTAATTA TCTGTTGCAA TTCTTTGAAG TTAACTCTGC 1920 

TAATATTTTG TGACmAAGTA TGCTCTTTGC TCATAATCCC CCTCCTTAAA TTTGTTCATA 1980 

TAAGATTATG ATATCTTAGA TTGCATAAAA AGACTAGGTT TAATAAAATT AAATTGTGAC 2040 

35 

AAATTAACGA CAAGAGAAAA TGTCAATTTT GTGACACAAA TAACATTTAA TTTATTGCTA 2100 

TAATGTATAT GTTAGAAAAT TTTAATAAGT AGAATCATGC ATCTAAAAGA GATTAATATT 2160 

4Q TAAGCTTCAA ATTTGAGTAA ACGTGGATTA CATAATTATC CCAATAAAAA AATCATTACG 2220 

ATTAAGTTCT TTTTATGTCG TCCACATACA ATACTTGTAA AATTAAATCA TATTTCCTGC 2280 

GTTGGATCCC ATCTTTTCAT ATCCTACAAT CAGGTCTATT TATAGTATCA TCTCAAATCC 234 0 

45 GGCTATTAAT TCTAATTCTC AGTGATGCGT TTTTTTATGA TGGGGTGTAT AAATTGTTTG 2400 

GCAAAAAGAA TTTAAAATGG TTAGGTGTCG TAGCAACGTT AATGATGACA TTTGTACAAC 2460 

TTGGTGGAGC CTTAGTTACC AAAACCGGAT CAGCTGATGG TTGTGGTTCT TCTTGGCCAC 2520 

50 

TATGTCATGG TGCGTTGATT CCAGAATTCT TTCCTATTGA TACGATTATT GAGTTAAGTC 2580 

ATAGAGCCGT TTCAGCTTTG TCTTTATTAA TGGTCTTATG GTTAGTTATC ACTGCATGGA 2640 
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TATTGCAAGC ATTAATCGGA GCTGCTGCTG TTATTTGGCA ACAAAACGAT TACGTTTTAG 2760 

cATTGCACTT TGGTATATCA TTAATCAGTT TCTCATCTGT ATTTTTAATA ACATTGATTA 2820 
5 

TTTTCTCTAT AGATCAAAAA TATGAAGCTG ACGAATTATA TATCAAAAAG CCATTAAGAC 2880 
GTTTAACATG GTTAATGGCA ATCATCATTT ATTGTGGTGT TTATACTGGT GCACTAGTGa 2940 
GACATGCGGA TGCAAGTTTA GCATATGGTG GTTGGCCATT GCCATTACCA CGATCTTGTA 3000 

10 

CCACATTCAG GAACAAGATT GGGTTCAACT CACGCATCGT ATCAnGGTCn nTTAA 3055 
(2) INFORMATION FOR SEQ ID NO: 298: 

15 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 74 8 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double. 

(D) TOPOLOGY: linear 

20 



ixi) SEQUENCE DESCRIPTION: SEQ ID NO: 298: 





TTCTTATTTA 


AAGAAGTCAT 


TTTTAGAAAT 


TGTTGAGACT 


TTAAAAAATG ATCCGTATAA 


60 


25 


AATAACACAA 


TCTTTTGAAA 


AATTAGAGCC 


TAAATATTTA' GAGCGATATT CAAGAAGAAT 


120 




TAACCATCAG 


CACAGGGTCG 


TCTATACCGT 


AGATGATCGA 


AATAAAGAAG TATTAATACT 


180 




ATCGGCATGG 


TCACATTATG 


ATTAATGAAT 


ATTCAATATC 


TGAATAACTT TAATGATAAG 


240 


30 * 


TTAATTAAAG 


AAACTAGTAT 


TTAAGTGTAG 


GGAAAATAGC 


GACGTTAATG CGTTGTTATC 


300 




TCTACACTTT 


TTAATTTTAT 


AATAGCGCAA 


GACTAAACAG 


ATTGAAATTA GTAACAATAA 


360 


35 


AAGAATAACG 


TATTATAATA 


AGGAATTTTA 


AATTGTGACT 


TTTTCGGAAT ATTAAATTTT 


420 


AGAAATATGA 


GGTTTTTAAG 


CGGATTCCTC 


ACAAAATTTT 


AAAAATATTT AAGCCTGAAA 


' 480 




ATGATAAAGC 


GGTAGGGAAC 


GTTTTTCTGA 


AaGTTAGTGA 


TACAATAGTT TTAAGTTGAA 


540 


40 


ATACAGGAGG 


ATGAATAACA 


TGAATCAGTC 


AGTCAAATTA 


CTTAAACATT TAACAGATGT 


600 




AAACGGCATT 


GCTGGTTATG 


AAATGCAAGT 


TAAAGAAGCA ATGCGTaACT ATATAGAGCC 


660 




TGTCAGTGAT 


CaAATTATTG 


AAGATAACTT 


GGGTGGCATT 


TTTGGAAAGA AAAATGCTGA 


720 


45 


GAATGGTCAA 


TACTCAATTA 


TGGAnTTC 






748 



(2) INFORMATION FOR SEQ ID NO: 299: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4718 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 299: 
ACCTCCGAAT AATTGATTCC ATTAACTTTT TTTGTGaAAA AtTTAAACAG GCGAAGTCTT 
CAATAAGTGA AGATGTCCAA ATTATAAAAA ATACATTCCA AAAAGAAAAG TTAGGTACAG 
TAATTACtAC ycTGGCGCAA GTGGTGGTGT TACGTATAAA CCAATGATGA GTAAAGAAGA 
GGCGACTGAA GTTGTTAATG AGGTCATTAC TCTATTAGAA GAGAAAGAAC GTTTGTTAcC 
TGGCGGATAT TTATTTTTAT CAGATTTGGT AGGTAATCCA TCGCTACTAA ACAAAGTTGG 
TAAGTTAATT GCCAGTATTT ACATGGAAGA AAAATTAGAT GCTGTTGTTA CCATTGCGAC 
AAAAGGTATT TCATTGGCAA ATGCGGTTGC TAATATTTTA AATTTACCAG TAGTAGTGAT 
TAGAAAAGAC AACAAGGTGA CTGAAGGTTC TACAGTTTCA ATTAATTACG TTTCAGGATC 
TTCAAGAAAA ATAGAAACAA TGGTACTTTC GAAGAGAACT TTAGCAGAAA ATTCAAATGT 
TTTAGTTGTC GATGATTTTA TGAGGGCTGG TGGCTCTATT AATGGTGTTA TGAATTTAAT 
GAATGAGTTT AAAGCCCATG TAAAAGGGGT ATCAGTACTT GTAGAATCAA AAGAAGTTAA 
ACAAAGATTG ATTGAAGATT ATACTTCCTT AGTGAAATTA TCTGATGTAG ATGAATATAA 
TCaAGAGTTT AACGTAGAAC CTGGCAACAG TTTATCTAAG TTTTCATAAA AGGAGTTTTA 
GTATTATGAA AATCATTAAC ACAACAAGAT TACCGGAAGC ACTTGGACCA TATTCGCATG 
CAACAGTTGT GAATGGTATG GTTTATACTT CTGGTCAGAT TCCATTGAAT ATTGATGGAC 
ATATCGTAAG CGCTGATGTT CAAGCACAGA CAAAACAAGT TTTAGAAAAT TTAAAGGTTG 
TTTTGGAAGA AGCAGGATCT GATTTGAATT CTGTTGCGAA AGCGACCATT TTCATTAAAG 
ATATGAATGA TTTCCAAAAA ATAAATGAAG TGTATGGTCA ATATTTTAAT GAACACAAGC 
CAGCGCGTAG TTGTGTAGAG GTTGCGCGTT TGCCAAAAGA TGTGAAAGTA GAAATTGAAT 
TAGTAAGTAA AATTAAGGAA TTATAATTTT CGATTAATAT GTTTAATCAA GCTTCTAAAT 
AAAACAGAGA GATATATACT ATAGGGGGGC TCACTACATG AAAGTGACAG ATGTAAGACT 
TAGAAAAATA CAAACAGATG GACGAATGAA AGCACTCGTT TCCATTACAT TAGATGAAGC 
TTTCGTAATT CATGATTTAC GTGTAATTGA AGGAAACTCT GGCTTGTTCG TTGCAATGCC 
, AAGTAAACGT ACACCAGATG GTGAATTCCG CGACATCGcg CATCCTATTA ATTCAGATAT 
GAGACAAGAA ATTCAAGATG CAGTGATGAA AGTATATGAT GAAACAGATG AAGTAGTACC 
AGATAAAAAC GCTACATCAG AAGATTCAGA AGAAGCTTAA TCAATTTTAT ATTTAGCGAT 
GTAATACATT TGCAATAAGT TGATTTGATA CTGTCGATAA AGCATAAAGC TTTGTCGGCA 
GTTTTTTTAG TTTGTATTAA TGTTTTTTTA TTTTTAATGA AAGGCTAATA AATATATACG 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
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10 



15 



20 



TGaTGCTCGT ATTTTTGAAG TAAGAAAAAA GTTGTTTTTA AAATTACAAC GAATTAAAAA 1800 

CAATGCCTTT TATATGTTGA AAGAGTATTG CaGATTAAAT TaTAATAATG ACGAaGgTAA 1860 

AATTTAATGG GGGTTAATGT TCATGCGAAG ACACGCGATA ATTTTGGCAG CAGGTAAAGG 1920 

CACAAGAATG AAATCTAAAA AGTATAAAGT GCTACACGAG GTTGCTGGGA AACCTATGGT 1980 

CGAACATGTA TTGGAAAGTG TGAAAGGCTC TGGTGTCGAT CAAGTTGTAA CCATCGTAGG 2040 

ACATGGTGCT GAAAGTGTAA AAGGACATTT AGGCGAGCGT TCTTTATACA GTTTTCAAGA 2100 

GGAACAACTC GGTACTGCGC ATGCatGCAA ATGGCGAAAT CACACTTAGA AGACAAGGAA 2160 

GGTACGACAA TCGTTGTATG TGGTGACACA CCGCTCATCA CAAAGGAAAC ATTAGTAACA 2220 

TTGATTGCGC ATCACGAGGA TGCTAATGCT CAAGCAACTG TATTATCTGC ATCGATTCAA 2280 

CAACCATATG GATACGGAAG AATCGTTCGA AATGCGTCAG GTCGTTTAGA ACGCATAGTT 2340 

GAAGAGAAAG ATGCAACGCA AGCTGAAAAG GATATTAATG AAATTAGTTC AGGTATTTTT 2400 

GCGTTTAATA ATAAAACGTT GTTTGAAAAA TTAACACAAG TGAAAAATGA TAATGCGCAA 2460 

GGTGAATATT ACCTCCCTGa TGTATTGTCG TTAATTTTAA ATGATGGCGG CATCGTAGAA 2520 

25 GTCTATCGTA CCAATGATGT TGAAGAAATC ATGGGTGTAA ATGATCGTGT AATGCTTAGT 2580 

CAGGCTGAGA AGGCGATGCA ACGTCGTACG AATCATTATC ACATGCTAAA TGGTGTGACA 2640 

ATCATCGATC CTGACAGCAC TTATATTGGT CCAGACGTTA CAATTGGTAG TGATACAGTC 2700 

ATTGAACCAG GCGTACGAAT TAATGGTCGT ACAGAAATTG GCGAAGATGT TGTTATTGGT 2760 

CAGTACTCTG AAATTAACAA TAGTACGATT GAAAATGGTG CATGTATTCA ACAGTCTGTT 2820 

GTTAATGATG CTAGCGTAGG AGCGAATACT AAGGTCGGAC CGTTTGCGCA ATTGAGACCA 2880 

GGCGCGCAAT TAGGTGCAGA TGTTAAGGTT GGAAATTTTG TAGAAATTAA AAAAGCAGAT 2940 

CTTA&AGATG GTGCCAAGGT TTCACATTTA AGTTATATTG GCGATGCTGT AATTGGCGAA 3000 

CGTACTAATA TTGGTTGCGG AACGATTACA GTTAACTATG ATGGTGAAAA TAAATTTAAA 3060 

AcTATCGTCG GCAAAGATTC ATTTGTAGGT TGCAATGTTA ATTTAGTAGC ACCTGTAACA 3120 

ATTGGTGATG ATGTATTGGT GGCAGCTGGT TCCACAATCA CAGATGACGT ACCAAATGAC 3180 

45 AGTTTAGCTG TGGCAAGAGC AAGACAAACA ACAAAAGAAG GATATAGGAA ATAATCATTT 3240 

ACGTATTTAA AATGGCTAGG ATAAAAGGAT AATCCTATGT AATATTAATG TAATCTTTAT 3300 

GATTTAATGA TTCGCATAGT AATGGAGTTA CATyTTATAT ATAATAGTAA TTGCGTAAGT 3360 

50 AAATAATTGG AGGACTATAA ATGTTAAATA ATGAATATAA GAATTCGTCA TTAAAGATTT 3420 

TTTCATTGAA AGGAAACGAA GCATTAGCGC AAGAAGTTGC TGACCAAGTA GGAATTGAAC 3480 



55 



30 



35 



40 



1127 



EP 0 786 519 A2 



GTATTCGTGG TTGTGACGTA TTTATTATTC AACCAACATC ATATCCTGTG AATCTACATT 3600 

TAATGGAATT ATTAATTATG ATTGATGCTT GTAAACGTGC TTCTGCAGCA ACAATCAATA 3660 

5 

TTGTAGTGCC ATATTATGGA TATGCAAGAC AAGATAGAAA AGCCCGTAGC CGTGAGCCAA 3720 

TCACTGCTAA ATTAGTTGCA AACTTAATCG AAAcAGctGG CGCAACTCGT ATGATTGCGT 3780 

TAGACTTACA TGCACCACAA ATTCAAGGAT TCTTTGATAT TCCAATTGAC CACTTAATGG 3 840 

10 

GTGTGCCAAT TCTTGCTAAA CATTTCAAAG ATGATCCGAA TATTAACCCA GAAGAATGTG 3900 

TCGTTGTTcA CCAGACCATG GCGGsnTTAC ACGTGCACGT AAATTAGCTG ACATTTTAAA 3 960 

15 AACTCCAATT GCAATTATAG ATAAACGTCG TCCTAGACCA AATGTTGCTG AAGTGATGAA 4020 

CATTGTTGGT GAGATTGAAG GACGTACGGC AATTATTATT GACGATATTA TTGATACAGC 4080 

AGGTACAATC ACTTTAGCTG CACAAGCATT AAAAGATAAA GGTGCTAAAG AAGTATATGC 4140 

20 TTGTTGTACA CACCCTGTTT TATCAGGACC GGCTAAAGAA CGTATCGAAA ATTCTGCTAT 4200 

AAAAGAATTA ATCGTAACAA ACTCAATTCA TTTAGATGAA GATCGCAAAC CATCTAACAC 4260 

TAAAGAATTA TCTGTTGCTG GTTTAATCGC ACAAGCTATC ATTCGTGTAT ACGAAAGAGA 4320 

25 ATCAGTTAGC GTATTATTTG ACTAATATTT AAAAGGCGTT TGACGAACAT ATTCCAAACG 4380 

TGTATAATAG TTTCGTTCGT GATTATACGA ATAAATAAAC ACTTG CAAGC AACGATGATG 4440 

TTGATGGGTA AGTGAGGTGC TCGTTTTGAG CAAAAATGAA AGGTGGAAAT GAGAATGGCT 4 500 

30 

TCATTAAAGT CAATCATCCG TCAAGGTAAA CAAACACGTT CAGATCTTAA ACAATTAAGA 4560 

AAATCTGGTA AAGTACCAGC AGTAGTATAC GGTTACGGTA CTAAAAACGT GTCAGTTAAA 4620 

GTTGATGAAG TAGAATTCAT CAAAGTTATC CGTGAAGTAG GTCGTAACGG TGTTATCGAA 4630 

35 

ttaggcgttg gttctaaaac tatcaaagtt atggttgc . 4718 
(2) Information for seq id no: 300: 
40 (i) sequence characteristics: 

(A) LENGTH: 3181 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

45 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 300: 
AAAATGCATA TAAATACATA TTAAGGAGGA TTTTATGAAT TTTCTTAAAC CTGCAAAGCA 60 

SO 

TATTAAGCCT TTGCCAGAAA ATCAGATAGA TGATACCTAT AAACGATTAC GTCTCCAAGT 120 
ATTTCTTGGT ATTTTCATCG GTTACGCTGG GTACTATTTA TTACGTAAAA ACTTTTCGTT 180 
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TGCTGTTTCC 


ATCGCATATG 


GATTTAGTAA 


GTTCTTTATG GGTACTGTAA 


gTGATCGGAG 


300 




CAATGCTCGG 


ATATTCTTAG 


TTCTTGGATT 




r*/T jv , tvt»*tv*tv 


ATTTGTTAAT 


360 


c 


GGGATTTGTA 


CCGTTCTTTA 


CATCAGGTAT 




TTTGTCCTAT 


TATTCTTAAA 


420 




TGGATGGTTT 


CAAGGTATGG 


GCTGGCCACC 


X X I— HVj<jV.V_Vj 1 




ACTGGTTTAG 


480 


10 


TGTAAGTGAA 


CGCGGAAGTA 


AGACTGCCCT 


' r V?/** TV KPPfl^ 

1 1 VjKjAAL.Ij I 1 


CiCo CATAATG 


TTGGTGGAGG 


540 


TATTATGGCA 


CCTATTGCTG 


CTTGGGGTAT 


TAvJVACAACT 


GCATTTAT CA 


ACTTTGGTTA 


600 




TTTAAAAGGT 


TTCGAAGGTG 


TATTCATTTA 


LCCTGCACTC 


TTAGCACTTA 


TCATTGCCGC 


660 


15 


AATTTCATAC 


GTATTGATTA 


GAGACACACC 


TCAATCTCAA 


GGTTTACCTC 


CAATCGAAAT 


720 


TTATAAAAAT 


GACTTTGCTA 


CAAGCGATAA 


^> ft ft ft ^ m#n^ 

GAAAACATTA 


GAAACAGAAT 


TAACTACAAA 


780 




AGAAATTTTA 


TTTAAATATG 


TACTGAACAA 


TAAATGGGTA 


TGGGCAATTG 


CCTTTGCAAA 


84 0 


20 


TATATTTGTT 


TATTTCGTGC 


GTTATGGTGT 


ACTTGATTGG 


GCGCCAGTCT 


ACTTAAGTGA 


900 




AGAAAAACAT 


TTCGACTTAA 


AAGCATCAGG 


TTGGGCATAC 


TTCTTATACG 


AATGGGCTGG 


960 




AATTCCTGGT 


ACATTATTAT 


GTGGTTACAT 


TTCTGATAAA 


TTATTCAAAG 


GTCGTCGTGG 


1020 


25 


ACCTGCAGGT 


TTCTTCTTTA 


TGTTAGGTGT 


CACAGTATTT 


GTATTAATTT 


ATTGGTTAAA 


1080 




TCCTCCAGGC 


AATGCTTGGT 


TAGACAATGT 


CTCATTAATT 


GCCATTGGTT 


TCTTAATATA 


1140 




TGGACCAGTT 


ATGTTAATTG 


GTTTACAAGC 


ATTAGATTAT 


GTAC CTAAAA 


AAGCAGCTGG 


1200 


30 


CACAgcAGCT GGATTAACAG GATTATTTGG 


TT AT CTGTTT 


GGTG CTGTAA 


TGGCCAACAT 


1260 




CGTCTTAGGT 


GCTGTAGTTG 


ATAAATTCGG 


TV r r/W^ TV TVTP 


GGTTTTATTT 


TATTAACAGC 


1320 




AATTAGTGTG 


TTTGCAATGT 


TGAGCTTTAT 




TV TAT TV TV TVf*T»T\/"» 

AATAAAGTAG 


GACAAGAAAC 


1380 


35 


CGTTCATCAT 


TAAATGATAA 


AAAATAAAGT 


v^/\ 1M1 oVj 1 1M 


X*-X Xi\ll.\jtAA 


AGATGATATA 


1440 




TTCATCTCTT ATAAGTTCAA CCATATGACT 


TTTTlTTTinT 
X 1 1 inl liwl 


A TTP 71 71 & 71 & A 
AX lUvvvvUi 


ATATTTACAT 


1500 


40 


TGCCACTTTT 


GTGTTTGCCC 


TGCTGTTTTA 


TTCAATTGAT 


X /"\V_/-\V». V^fAVs, 1 X 


AGGATAAACT 


1560 


CTAAAAGCCA 


TTTTCCCTTG 


ATACTTAGAT 


GAAGCTAAGA 


TACCTTTTTC 


TACCAATAAT 


1620 




TCCCTAGGAA 


ATAGAAAGTA 


GCCATTTAAT 


TCATCATCGA 


TAACAGCAAC 


AATCAGGTAA 


1680 


45 


TCAGCAAACT 


CTTCAATTTT 


GTATGGCCGA 


TTATAATTAT 


CtTCGTCTTT 


TGTCCAACAT 


1740 




GTCACGAAAT 


ATCCCGATTT 


AGTCGGTGTT 


TTCTTAGCTA 


ACCTACTTTG 


ATATGTTTCC 


1800 




TCTTTAAAGC TAAATGTTAA TGCyTCGTAA 


TCTTGATTAT 


ATTTTTCTTC 


AGTTAAATCT 


I860 


50 


TTAACTTCTG 
CAATCTCACT 


ATTCTTCACT 


AAAAATATTT 


TTCAACAGTA 


TTTTAGATTT 


ACACATATGC 


1920 




TTATTTTTTC 


ATAATCGTAT 


CATATATTTA 


rrrrrrrcGA 


AAAATACACT 


1980 
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TGTATCAACT GTCAAACGAT CACGTAATAA ATAGACGATT AACATTGcTG CTAAAGCACA 
AAGTGACTCA GCAATTAATA ATGACCAAAT GACACCTGTT AGTCCAAACA AAGCATTCAT 
AATAAATAAT ACTGGAATGA TAATTGCACC TTGTAAAATG GCCATAATTG TAGCACCACG 
ACCTTGCCCA GTCGCTTGAA GCATACCAGT AAACAAGAAA CCTATACCAT TTAATAATAA 
TGATGCCATT GTTACTTTCA AAATAAATGt CGCCATCTCA ACAATGGCTT GATCAGTAGT 
AAATAGTCCG ACCATATGAT GTCCAATTGT AAATACAGCA CTCATACATA CAACAAAGAT 
AACGCCGATA GACATGATAA CTGCTTTGAT AACGTCTTTC ATACGGCCTT TATTTGCCAT 
AAAGTTATAT GCAATTAGTG GTACAACACC TTCACATAAT CCCATGATAA TAAGTTCTGG 
aAATTGCACA AGTCTAAATG AG AT AC CAT A ACTTGCaATC GCGAAGTTTC CATAATGTGC 
TAAAAATAAA TTTAAAACTA ATCCTGTGAA TCCCATTAAG ATACTCATTA AAAATGCAGG 
AATACCGATT TTAAAGATTT CAGAAAGCAT TTCTTTATTA GGTTTCGCAA GTTTAATATT 
AACTGACACA ACGTCACTAT TTTTCATAAA ATAAATGATA AAGAACAGAG CAGCAGCAAC 
ATTACTGATT GCAGTACCCA AAGCTGcACC AACAACGTTT aAATCAAAAC CAAAAATTAA 
AATTGGATCT AAAATAATAT TTAAGCCTAC ACTAGCTAAC ATACCAATCA TAGAAACCAT 
TGGTGCCCCA ATTGCACGTG CAAATTGTTC TAATATGAAG AACAAAATTA CAAAAGGTGC 
ACTTAAAAAC ATTACTTTCA AATAATTACT TGTTAAAGCT AACGTTTCAC CTCTCGCCCC 
TAAAATTGCT GCGATTTGAT CACTGAATGG TAAAGTAACT AAAATCACGA TAAGTCCTAG 
TGCAATACCA CCATAAATAG AGAAACTACT TACAAATTTA CTCTTAmTAT AGTCTTTCGC 
ACCTAATAAA CGTGAAATAT AAGTTCCTGC ACCAACGCCA AATAAATTAC CTAACCCCAT 
T 

(2) Information for seq id no: 301 : 
(i) sequence characteristics: 

(A) LENGTH : 4 029 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 301: 
TCATCACCTT CAAATAAATA GGCATGCGAT AATTTATTTG AATGATATGC ATTCGTCAAT 
TGTTGCTGTT CATCCATTCA TTACAAACTC CCTTTTGCTT TTATATAAAA AGGTTGCCAA 
AGAGCAACTA ATTACTGCAA CAATAGCGAC CATGATTTGT GATTATTTTT AGAACCACAA 
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TTATTAATAC ACTATTTTAA GTATCTCTAA TTGATGATTG TATTATAGAA TTAAAATTGA 300 

TGGAATGCAT CAACTGGCAT AACAAATACA GTAGCACCGC CAACTTCAAC TTCAACTGGA 360 

5 TATGGAATGT ACGAATCCGC ACTGCCTCCC ATAGGTGTAA TAGGTGAAAC CAACTGTTCT 420 

CTATTACCAC ACGTTTGATT AATCACAGAC AATATTTCAT CTACACGGTC ATCATTGACA 480 

CCACATAAGA ATGTTGTATT ACCCGCTCTT AAAAACCCAC CTGTTGTTGC CAATTTTGTT 540 

10 

GCTCTAAAGT TATTTTTAAC AAGTTGATCT GCAAGTTCCT GACTATCTTG ATCTTGTACG 600 

ATCGCTATAA TCATTTTCAT TTTATAACAC CTCTTCTAAC AATTATATCA TATCTTTTCT 660 

AAATATTTGA TGATAGTTTG ATACGTGTCT TCAACAACAT TTTCAAGAGG TTGATCTGCA 720 

15 

TTAACGCTTT TGAACCGTTG TGATTCATTA TGAATGATTT CTTGGTAACC TTCAATTACT 780 

TTTTCGTGAA cTTTAAATCT TCTTGATCTA ATCTATTTTG ATCTCTTGAA TTTTTAATAA 840 

20 TACGTTCGCG ACCTACTTCA GCACTAACAT TTAAATAAAT CGTCAAGTCT GGaTATAATC 900 

CATTTATTGC AAATTCGTTT AATGCTCTTA CTTCTTCAAC GCCAATCCCT CTAGCATAAC 960 

CTTGATAAGC TAATGAACTA TCGATATAGC GATCACACAA CACAACCTTA CCTTCTTTTA 1020 

25 AAGCTGGTAT GACCTTTAAT ACAAGATGTT CTCTTCTAGA TGCAGCAAAT AACATTGcTT 1080 

CaGTtCTAAT GTCCATATCA TTGCCcTTCT AATACAATTT TACGTATTTC TTCACCAGTA 1140 

GGAACACCAC CTGGTTCTCT AGTCATAATG ACATCATAAT CTTTTACTAA TCTATGGTAA 1200 

ACTTCATTAA TTACAGTTGT TTTTCCAGAG CCTTCTGGGC CCTCAAAAGT TATAAAAGCT 1260 

GACATTTTAT TCATCCTCAA CTAAAATTTT ATTATTTTTA ATTCCTTCAA CTATCATTCC 1320 

AGTTTCCAGA TATTCATTTA CCAATTCTAT CATATTTTCA GTTATTGTTT CTCCTTTGAA 1380 

35 

AATAATAGGA ATcCCTGGcG GATACGGGAC AATATGTCGC GCCAGAACTT TACCTTTgCC 1440 

TTTTcAAATC ACACCAAGTA ACATATTCAA AGCGTTTTGG TTTATAGTTA CCTTCAGTyG 1500 

TTAAAAGTTG TGTTTGTTTA ACTTTAGAAA CTGATTTTTT CGGTAAAATC ATATCTTCAA 1560 

40 

TTTTACGTAA AAGCGAATCA AATAAATACG TATCATCATG ATGCCATAAC GGCAATATCG 1620 

CTAATGCTTG ATAGTCGTCC GCTAATTCTA AATAGATATG TGCATTCATA AACCAATTTT 1680 

4S GAATATCATG ACCTGTAAAA CCTTCATATT TTATCAGCAA CTTCAACGGA TCATCAACTT 1740 

GAAGCATTTC AAAACCCTTC TTCTCCAAAC ATTCGATTAA TTGCGCTCTC TTATCAAAAA 1800 

ACACGGTACT ATCATATGTT TTATAGAACT CGGCAGCTGA CTCTAAACTA GCCATAATCA 1860 

50 AATACGAAGG ACTAGATGTT TGGAAGTAGC TTAGATATTC TATAATAGTT TCTCTATAAG 1920 

GTGCATTTTT ATGAATATAA AGTACCGAGC CCATCGTTAA AGCTGGTAAC GTTTTATGAA 1980 
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CAAAGTGCGC GCCGTGTGCT TCGTCAATGA 
TGATAACCTC TTCTACATTA AATGTTTCAC 
GTTTGTGACC GTCATTATTC AAACGGCTTA 
GACTTTGATG CGTTTCAATA AAATGCCCTT 
CAGATTTATG TACATTTCTT GCCATTAAGA 
TGACAGATAA TATTCCTGAA GTGGTGCCAT 
GTTTCTCCAC CTGCTTCATA CTTTCCAAAA 
AATCCAGGTA TTTCAGTTTT ATCCATTGTC 
ATATTTTTAT GACCCGGAAC ATGCAAAGAA 
TTATTTAAAA TAGGTTGCTT CATGATATAC 
GTTACTTTCA AAAGTATTAA TTATATAGTA 
ATGCAATAGC TTGTCTATTG TATAATAATT 
TATTAGACAT AAAATCTAAA AACAGCAGTA 
GCTGTTCACT TTTTATAATA CTTCTGAATG 
AATAATCAAA AGTGCACATT ATTAAAATAT 
TCATTTCTTG TCTAGCAACG TTCTACTCTA 
AAGAACCTTT CTTGACTTGT GACAATCGCT 
ACTCATTTAG CTCTACTAAA CTCGTTGCGC 
TTCACTTCGC CAAGCCATTT TTCTTTGTGT 
AAAAAGAGAC cTCACGGTCT CAACTTGCCT 
TGGCTACCAT CGTCGCTAAA GACCTTTCTT 
TCCTTCGGCT CTCGCTTACT CATTTAGCTC 
CGTCAGATTC AAACGTTTTC ACTTCGCCAA 
TGACGTTTTA GrCATAAAAA AAAGAGACcT 
TTTTTGCCTG GCAACGTTCT ACTCTAGCGG 
aCCTTTCTTG ACTTGTGACA ATCGCTTGCT 
ATTTAGCTCT ACTAAACTCG TTGCGCTCTT 
CTTCGCCAAG CCATTTTTCT TTGTGTTTGC 
AAGAGACCTT GCGGTCTCAA TGCGGCTCAT 



GTACAGGAAT 
CGTAATAGTT 
AATTAACTTT 
CTTGTTGGCT 
TATCGCCTTT 
TCACTAAGAA 
TGACTTCTTC 
ATTGATAATT 
ATCGCTTCTT 
GCTTCCTTTA 
ACACTTCTTT 
AATTTCCTTT 
AGATGATTTA 
TCTTCACTTA 
CAATTTCACA 
GCGGAACGTA 
TGCTTCTTTC 
TCTTTTCTCG 
TTACTTTTTA 
GGCAACGTTC 
GACTTGTGAC 
TACTAAACTC 
GCCATTTTTC 
TGCGGTCTCA 
AACGTAAGTT 
TCTTTCCTCT 
TTCTCGTTTC 
TTTTTATTTT 
CGCATCCATT 



ATTTAATTGG 
AGGATAAGTC 
ATTATAATGA 
AATATCGAGC 
TTTCTGTGAA 
ATAAGCATCA 
AGGATGATGT 
GAGATAAATG 
CTTGATTTAA 
TTTACACTGT 
GACAAAAGTT 
TTGTACTTCG 
TGATTAAAAA 
TACTTCTAGT 
CTCAATGCGG 
AGTTAGCTAC 
CTCTCCTTCG 
TTTCGTCAGA 
TTTTGACGTT 
TACTCTAGCG 
AATCGCTTGC 
GTTGCGCTCT 
TTTGTGTTTA 
ATGCGGCTCA 
GGCTACCATC 
yCTTCGGCTC 
GTCAGATTCA 
GACGTTTTAG 
TTTTGCCTGG 



TGCAAAGATT 
AACACAGCAA 
TTCGTTAACG 
GCATGTAACA 
AAAGACTGGA 
TAATCTGAAT 
AAATCAnCTn 
ACCGATAGTC 
ACTTTCTAAT 
TTTGGAATTA 
AGTGTTACTT 
ATTTAAAAGA 
CTATCTTACT 
CACAGATTTA 
CTCATCGCAT 
CATCCTCGCT 
GCTCTCGCTT 
TTCAAACGTT 
TTAGACATAA 
GAACGTAAGT 
TTCTTTCCTC 
TTTCTCGTTT 
CTTTTTATTT 
TCGCATCCAT 
GwCGCTAAgA 
TCGCTTACTC 
AACGTTTTCA 
ACATAAAAAA 
CAACGTTCTA 



2100 

2160 

2220 

2280 

2340 

2400 

2460 

2520 

2580 

2640 

2700 

2760 

2820 

2880 

2940 

3000 

3060 

3120 

3180 

3240 

3300 

3360 

3420 

3480 

3540 

3600 

3660 

3720 

3780 
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CATGGGAACA GGTGTGACCT CCTTGCTATA GTCACCAGAC ATATGAATGT AATTTATACA 3900 
TTCAAAACTA GATAGTAAGT gAAAAGTGGA TTTTGCTTCG CAAAACATTT ATTTTGGATT 3960 

5 

AAGTCTTCGA TCGATTAGTG ATTCGTGCAG CTCCACATGT GCACCATGCT TGCCACCTCG 4020 
GAACCTATT 4029 
(2) INFORMATION FOR SEQ ID NO: 302: 

10 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7159 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 302: 



20 


GATGCAATAG 


TTGAGTAGTT 


ATAAGTAGCT 


ACATACAACC 


GCTCAAATAT 


AGGTTCAAGA 


60 




ACATTTTTAA 


TGAAGAAAGC 


GATTTTCCCm 


CAGAGTGCAA 


ACGCTTGACT 


CAATAACGAA 


120 




ATGTCACCTA 


TGTATGGCGT 


GACTTATTAT 


ACAGGaGGTG 


CAAAGTATGT 


TTGCTATTAT 


180 


25 


TGAAACAGGT 


GGAAAACAAA 


TCAAAGTAGA 


AGAAGGTCAA 


GAAATCTTCG 


TTGAAAAATT 


240 




AGACGTAAAC 


GAAGGAGATA 


CTTTTACATT 


TGATAAAGTA 


TTATTTGTAG 


GTGGAGATTC 


300 




AGTTAAAGTT 


GGAGCGCCAA 


CAGTTGAAGG 


TGCAACAGTT 


ACTGCTACTG 


TTAATAAACA 


360 


30 


AGGTCGCGGT 


AAAAAAATCA 


CTGTATTCAC 


ATACAAACGT 


CGTAAAAATT 


CAAAACGTAA 


420 




AAAAGGCCAT 


CGTCAACCAT 


ACACTAAATT 


AACAATCGAT 


AAAATCAACG 


CGTAATTATT 


480 


35 


ATGATTACTG 


TTGATATTAC 


AGTTAATGAT 


GAAGGCAAAG 


TAACAGACGT 


TATTATGGAT 


540 


GGCCATGCTG 


aCCATGGTGa 


ATATGGTCAT 


GATATCGTTT 


GTGCTGGAGC TTCAgCTGTA 


600 




TTGTTTGGTA 


GTGTTAATGC 


GATTATAGGA 


TTGACATCTG 


AGAGACCAGA 


TATCAATTAT 


660 


40 


GACGACAATG 


GTGGTCATTT 


TCATATAAGA 


AGCGTTGATA 


CAAACAACGA 


TGAAGCGCAA 


720 




CTAATTCTTC 


AAACAATGCT 


TGTGTCTTTA 


CAAACTATTG 


AAGAAGAATA 


TAATGAGAAT 


780 




ATTAGATTAA 


ATTATAAGTG 


AGGTGCATTC 


CGATGTTAAA 


ATTAAACTTA 


CAATTCTTCG 


840 


45 


CATCTAAAAA 


AGGGGTAAGT 


TCTACAAAAA 


ACGGACGTGA 


CTCTGAATCA 


AAACGCTTAG 


900 




GTGCTAAACG 


TGCTGACGGT 


CAATTCGTAA 


CAGGTGGTTC 


AATTTTATAT 


CGCCAACGTG 


960 




GTACTAAAAT 


TTACCCTGGT 


GAAAATGTAG 


GTCGTGGTGG 


CGATGATACA 


TTATTCGCTA 


1020 


50 


AAATCGACGG 


CGTTGTTAAA 


TTCGAACGTA 


AAGGTCGCGA 


CAAAAAACAA 


GTTTCTGTAT 


1080 




ATGCAGTAGC 


TGAATAATTT 


TGTCTAGTTA 


ACACCAGAAG 


TGAATCTTCT 


GGTGTTtTTT 


1140 
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AGACGTTATA 


CTAAATGTGC 


AcTGTATAAG 


AGCCCCTAAT 


CACTAAACTA 


TAAGGGGGAC 


1260 




AAAGGAATAC 


AGTTGCAGCG 


TTTAAAGAAT 


AAACTGTACC 


ACAATTGGTG 


CTGAGAAATA 


1320 


£ 


TAAGTATTTT 


AAAGCAAAGA 


TTTATAAAAG 


TAACTGCATA AGAGCCCCTA ATTATTTACA 


.1380 




ATATATAAGG 


GGCTCTAATA 


TGCTATAATT 


ATTGGGAAAA 


TGAAAATTAT 


ATGTAAAAGA 


1440 


70 


GGTGAGATAT 


ATGTTTGTCG 


ATCAAGTCAA AATATCTCTT AAAGCCGGTG 


ATGGTGGTAA 


' 1500 




TGGTATTACC 


GCATACAGAA 


GAGAAAAATA 


TGTACCATTT 


GGTGGACCAG 


CTGGCGGTGA 


1560 




CGGTGGTAAA 


GGTGCTTCAG 


TCGTATTTGA 


AGTGGATGAA 


GGTTTAAGAA 


CGTTATTAGA 


1620 


75 


TTTTAGATAT 


CAACGTCATT 


TTAAAGCAAG 


CAAAGGTGAA AATGGCCAAA 


GTAGTAATAT 


1680 




GCATGGTAAA 


AATGCGGAAG 


ATTTAGTATT 


AAAAGTTCCA 


CCTGGTACAA 


TTATTAAAAA 


1740 




TGTTGAAACA GACGAAgTGT TAGCAGATCT TGTTGAAGAT GGTCAAAGAG CTGTAGTAGC 


1800 


20 


GAAGGGCGGT CGAGGTGGCC 


GAGGTAATTC 


ACGTTTTGCA 


ACACCTAGAA 


ACCCTGCACC 


1860 




TGACTTCAGT 


GAAAAAGGTG 


AACCAGGTGA 


GGAATTAGAT 


GTATCTTTAG 


AATTGAAATT 


1920 




ATTAGCTGAT 


GTAGGATTAG 


TAGGTTTCCC 


TAGTGTGGGT AAATCGACTT 


TATTATCTAT 


1980 


25 


CGTTTCAAAA 


GCTAAGCCTA 


AAATTGGGGC 


ATATCATTTT 


ACAACGATTA 


AACCAAATCT 


2040 




AGGTGTTGTT 


TCAACGCCTG 


ATCAACGTAG 


TTTTGTTATG 


GCAGATTTAC 


CAGGTTTAAT 


2100 


30 


TGAAGGTGCA 


TCTGATGGCG 


TTGGATTAGG 


ACATCAATTT 


TTAAGACATG 


TAGAGAGAAC 


2160 


AAAAGTTATT 


GTTCACATGA 


TTGATATGAG 


CGGTTCTGAA 


GGTAGAGAAC 


CTATTGAAGA 


2220 




TTATAAAGTC 


ATTAATCAAG 


AATTAGCTGC 


GTACGAGCAA 


CGTTTAGAAG 


ATAGACCTCA 


2280 


35 


AATCGTAGTA 


GCTAACAAGA 


TGGATTTACC 


TGAATCACAA 


GATAATTTAA 


ACTTGTTTAA 


2340 




AGAAGAAATT 


GGCGAAGATG 


TGCCAGTTAT 


TCCAGTTTCA 


ACAATAACGC 


GTGATAATAT 


2400 




TGATCAATTA 


TTATATGCAA 


TAGCAGATAA 


ATTAGAAGAA 


TATAAAGATG 


TTGACTTCAC 


2460 


40 


AGTTGAAGAA 


GAGGAGTCAG 


TTGGCATTAA 


CCGAGTATTA 


TATAAACATA 


CACCGTCACA 


2520 




AGATAAATTT 


ACAATTTCAA 


GAGATGATGA 


TGGTGCTTAT 


GTGGTAAGTG 


GTAATGCTAT 


2580 




TGAAAGAATG 


TTTAAAATGA 


CTGACTTTAA 


CAGTGATCCA 


GCAGTACGTC 


GATTTGCTCG 


2640 


45 


TCAAATGCGT 


TCGATGGGTA 


TTGATGATGC 


GCTTAGAGAA 


CGTGGTTGTA 


AAAATGGTGA 


2700 




TATCGTTAGA 


ATTCTTGGCG 


GAGAATTTGA 


ATTCGTTGAA 


TAGGAGCGAA 


ACATGATGGA 


2760 




CAATAAAGAT 


TATAAAAAGT 


TTTATTTAAT 


TAGAGAAGAT 


GTCTTGCCTG 


AATCCGTGGT 


2820 


50 


TAAAACATTG 


AAGATTAAAG 


ATGCCTTAAA 


AAGTGATCCG 


ACATTGTCCA 


TTTATGATGC 


2880 




CGTTAAACAG 


TTTGATCTAT 


CTAGAAGTGC 


TTTTTATAAA 


TATAGAGAAA 


CGATATTTCC 


2940 
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10 



15 



TGTTGGTATG TTGGCACGTG TACTAGATGT TATATCAAAG TTAGAACTAT CTGTATTAAC 3060 

GATTCATCAA AGTATTCCAA TGGAAGAAAA AGCAACAATA ACATTATCAC TGAATGCTAA 3120 

ATCTAAAGAA ACTTCAGTAG AAGATGTTAT TGGCGCTTTG AGAAATTTAG ATTATGTATC 3180 

AAAAGTAGAA TTAATTAGTA TGAGTATGTA AGGATGTGCC TATAATGTAC GCGTATGTCA 3240 

AAGGTAAGTT AACACATTTA TATCCTACAC ACGTAGTTGT TGAAACTGCT GGTGTTGGTT 3300 

ATGAAATTCA AACACCAAAT TCTTATCGTT TTCAAAAGCA TCTAGATCAT GAAGTTTTAA 3360 

TTCATACATC TTTAATTGTT CGTGAAGATG CACAATTATT GTATGGATTT AGTAGTGAAG 3420 

AAGAGAAAGA TATGTTCTTG AGTTTAATTA AAGTTACTGG TATTGGTCCG AAATCAGCTT 3480 

TAGCTATTTT AGCGACAAGT ACGCCTAATG AAGTAAAACG TGCCATTGAA AATGAAAATG 3540 

ATACGTATTT AACTAAATTC CCAGGAATTG GTAAGAAAAC GGCAAGACAG ATTGTCTTAG 3600 

20 ATTTAAAAGG TAAAGTGAAA ATTACTGAAG AAGATAGCGA TTCATTATTA CAAGTAGACG 3660 

CTACTTCGAC GGTGCAAGAT CAATTCGTGC AAGAAGCAAT GTTAGCGTTA GAAGCATTAG 3720 

GTTATTCTAA ACGAGAGCTT GCAAAAGTTG AGAAAACGTT AAATAAAAAT AAATATGACT 3780 

25 CAGTTGATGA AGCTGTTAAG GCAGGTCTTC AATTAGTTGT ATCTTAATTT TAAATAGATT 3840 

AATAGGGGAA GTGTTGTCAT GAATGAGCGT ATGGTTGATC AATCAATGCA TAGTGAAGAA 3900 

ACTGATTTCG AATTGTCGCT TAGACCTACG AGATTACGAC AATATATTGG TCAAAATTCA 3960 

ATAAAAAGTA ATTTAGAAGT ATTTATTAAA GCGGCTAAAC TTCGTCATGA ACCATTAGAT 4020 

CATGTATTGC TTTTTGGCCC CCCTGGATTA GGTAAGACAA CATTATCTAA TATCATTGCC 4080 

AATGAAATGG AAGTTAATAT ACGTACAGTA TCAGGGCCTT CATTAGAAAG ACCTGGTGAT 4140 

TTGGCTGCAA TTTTATCAGG ACTTCAACCT GGAGATGTTT TGTTTATTGA TGAAATACAC 4200 

AGACTGAGTA GTGTTGTTGA AGAAGTGTTA TACCCTGCAA TGGAAGATTT CTTTTTAGAT 4260 

ATTATCATTG GTAAAGGCGA TGAGGCTAGA AGTATCCGTA TCGACTTACC TCCATTCACT 4320 

TTGGTAGGTG CAACAACGCG AGCTGGCAGC TTAACAGGTC CACTAAGGGA TCGATTTGGT 4380 

GTGCACTTAA GATTAGAATA TTATAACGAA TCAGATTTAA AAGAAATCAT TATTAGAACA 4440 

45 GCTGAGGTTT TAGGCACAGG TATTGATGAA GAAAGTGCCA TTGAACTTGC TAAACGTTCT 4500 

AGAGGGACTC CAAGAGTAGC AAATCGACTA TTGAAGCGGG TAAGAGACTT CCAGCAAGTG 4560 

AATGAAGATG AACAAATATA CATTGAAACA ACGAAGCACG CATTAGGTTT ACTTCAAGTT 4620 

50 GATCAACACG GACTAGATTA CATTGATCAT AAAATGATGA ACTGTATTAT TAAGCAGTAT 4680 

. . AATGGCGGAC CTGTTGGTTT AGATACGATT GCCGTAACAA TTGGTGAAGA ACGTATTACA 4740 
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GGCAGAAAAG CAACACCATT AGCTTATGAA CATTTTGCAA AGTCGAATGA GGAGAGAGAA 4860 

TAACGTGAAT ATTGAAGAAT TTGACTATGA CTTACCAGAA TCATTAATTG CTCAAACGCC 4 920 

5 

TTTAAAAGAT CGTGATCATA GTCGTTTATT AGTCATGGAT AGAGAAACTG GTGAAATGAA 4 980 

ACATTTACAT TTCAAAGATA TCATTGAGTA TTTTAGACCT GGTGATACAT TAGTGCTTAA 5040 

CGATACGCGA GTAATGCCAG CTAGACTTTT TGGTTTAAAA GAAGAAACTG GTGCAAAAGT 5100 

TGAAATGTTA ATGTtAACTC AAATTGAAGG TAATGATTGG GAAGTCTTAC TGAAACCAGC 5160 

TAAGCGTATT AAAGTTGGTA ATAAATTGAA TTTTGGTAAT GGCAAAATTA TAGCTGAATG 5220 

,5 CATAAAAGAA ATGGATCAAG GTGGACGCAT CATGCGTTTA CATTATGAAG GTATTTTACA 5280 

AGAAAGATTA GATGAATTAG GGGAAATGCC ACTGCCACCA TACATCAAAG AACGTTTAGA 534 0 

TGATCCAGAT CGTTATCAAA CAGTTTACGC TAAAGAAAGT GGTTCAGCGG CAGCACCAAC 5400 

20 AGCAGGATTA CATTTTACTG ATGAGTTATT AATTGAAATT AAAAATAAAG GTGTTAATAT 5460 

CGCATTTGTT ACATTACATG TTGGGTTAGG TACGTTTAGA CCGGTGAGCG TAGACGATGT 5520 

GAATGACCAC GAAATGCATA GTGAATATTA TCAAATGACm CAAGAAACAG CTGATTTATT 5580 

25 

AAATGATACT AAGcCAAAGG ACATCGCATT ATATCAGTTG GTACAACTTC AACACGTACA 5640 

CTTGAAACAA TTCGACGCGA TCATGATAAA TTTGTTGAAA CGAGTGGCTG GACTAATATA 5700 

TTTATTTATC CAGGATTTGA TTTTAAAGCA ATTGATGGCC AGATTACTAA TTTTCATTTA 5760 

30 

CCAAAATCAA CATTAGTTAT GCTAGTATCA GCGTTTAGTA GTCGTGAAAA TGTTCTGAAT 5820 

GCTTATAAAA CGGCAGTAAA TTTAGAATAT AGATTCTTTA GTTTTGGCGA TGCAATGTTA 5880 

ATTATATAAA AAGAATGTGA GGATTTTGAA TATGCCTGCA GTAACATACG AACACATTAA 5940 

35 

AACTTGTAAA CAATCAGGTG CGCGTTTAGG TATCGTGCAC ACACCACACG GTTCATTTGA 6000 

AACXCCTATG TTTATGCCAG TTGGTACTAA AGCAACCGTT AAAACAATGA GTCCAGAAGA 6060 

40 GTTAAGACAA ATTGAAGCAA AAATCATTTT GGGCAACACA TATCATTTGT GGTTACAACC 6120 

CGGAAATGAT ATTATCAAAC ACGCTGGGGG ATTACATAAA TTCATGAATT GGGATGGTCC 6180 

GATTCTTACA GATTCAGGCG GTTTCCAAGT GTTTAGTTTA AGTAATTTAC GTAAAATTAC 6240 

45 AGAAGAAGGC GTGGAATTTA GACATCATAC TAATGGGTCT AAATTATTTT TGAGTCCTGA 6300 

GAAATCAATG CAAATTCAAA ATGATTTAGG ATCTGATATT ATGATGGCAT TTGATGAATG 6360 

TCCACCGATG CCTGCTGAAT ATGATTATGT AAAAAAATCT ATTGAACGTA CAACACGTTG 6420 

SO 

GGCGAAAAGA TGTCTAGATG CACACCAAAG ACCTGAAGAT CAAGCATTGT TCGGCATTAT 6480 

ACAAGGTGGC GAATATGAAG ATTTAAGAGA ACAAAGTGCA AAGGATTTAG TAGAATTAGA 6540 
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AATGGTTGAA CATACAGAGC AGTTTATGCC TAAAGATAAA CCAAGATATT TAATGGGTGT 6660 

AGGATCTCCa GATGCGTTAA TCGAATGTAG TATTCGCGGC ATGGATATGT TTGATTGTGT 6720 

CTTACCGACA CGTATTGCCA GAAATGGTAC TTGTATGACA TCGCAAGGTC GTTTAGTTAT 6780 

TAAAAATGCA AAATTTGCAG ATGATTTAAG ACCGTTAGAT GAGAATTGTG ACTGTTATAC 6840 

ATGTCAAAAC TATTCAAGAG CGTATATACG TCATTTAATC AAGGCAGAGG AAACTTTTGG 6900 

TATTCGTCTT ACT ACT ATT C ATAATTTACA TTTTCTGCTA AAATTAATGG AAGATATAAG 6960 

ACAAGCCATT CGAGAAGATC GTCTTTTAGA TTTCAAAGAA GAATTCTTCG AGCAATATGG 7020 

ATTAAATGTT GAGAACCCAA AAAACTTTTA AGCAAGAGGA GCGTATAAAA TGCAATTTTC 7080 

ATTACTAATA TATATAGTCG TAATTTTTGC GGTTATGTAT TTCTTGATGA TCAGACCACA 7140 

ACAAAAACTG TGCGAAACA 7159 
20 * (2) INFORMATION FOR SEQ ID NO: 303: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3159 base pairs 

(B) TYPE: nucleic acid 
25 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



10 



15 



30 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 303: 

TCCATTTATA GAAATTTCTA AAGCAGAnAA TAAGATAGAA GATATCGGCC AAGGTGCAGA 60 

AATCATCAAA AGAACACAAG ACATTACTAG CAAACGATTA GCTATAACTC AAAACATTCA 120 

35 ATTTGATTTT GTAAAAGATA AAAAATATAA CAAAGATGCC CTAGTTGTTA AGATGCAAGG 180 

CTTCATTAGC TCTAGAaCAA CATATTCAGA CTTAAAAAAA TATCCATATA TTAAAAGAAT 240 

GATATGGCCA TTTCAATATA ATATCAGTTT GArAACGAAA GACTCTAATG TTGATTTAAT 300 

TAATTATCTT CCTAAAAATA rAATTGATTC AGCAGATGTT AGTCAGAAAT TAGGCTATAA 360 

TATCGGCGGA AACTTCCAAT CAGCGCCATC AATCGGAGGC AGTGGCTCAT TCAACTACTC 420 

TAAAACAATT AGTTATAATC AAAAAAACTA TGTTACTGAA GTAGAAAGTC AGAACTCTAA 480 

AGGTGTTAAA TGGGGAGTGA AAGCAAATTC ATTCGTTACA CCGAATGGTC AAGTATCTGC 540 

ATATGATCAA TACTTATTTG CACAAGACCC AACTGGTCCA GCAGCACGAG ACTATTTCGT 600 

CCCAGATAAT CAACTACCTC CTTTAATTCA AAGTGGCTTT AATCCATCAT TTATTACAAC 660 

ATTGTCACAC GAAAGAGGTA AAGGTGATAA AAGCGAGTTT GAAATCACTT ACGGCAGAAA 720 

CATGGATGCT ACATATGCTT ACGTGACAAG ACATCGTTTA GCCGTTGATA GAAAACATGA 780 
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AAAAATTAAA AGCATCACAC CTAAGTAAAC AGTTCaATCA TCTTAAAAAA TCCTGGGACA 900 

CTTCATACTT GTCTCAGGAT TTTTTmACAA ATTGAATCAG CCTCATAACA TTAAATTATT 960 

TTATCGTACA TTAAATTTAA TAATAACAAC TGATTTTTAT AAGAATAAAG TATCGAmCCA 1020 

TAGTAGATAC ACAAATAATA CAAATGAAAC AATTTAACTT GAAAGCTTAa ATAAATATTA 1080 

TCAAGTTAAT AAACAATTAA TTTTTAGATG GATTCATCAA AAATCGTAAA AAAGCACAAT 1140 

TTGTATTTTA CAAACATTAA TTAAAAAAGA AAGCAAGACA TTCGTGCAAT CGGTTACCTT 1200 

AAATTGTTTA CAACTGTCAA CAATACCAAG GTTTTATTAA CTATATTTCT CACAAAATTA 1260 

GCTTTTAGCA TTCCAAACAA AAAAGGTTAA ATCGAACGGA ATTATGGCAT TTTTAACTTA 1320 

ATTGTAAAAA AAGTTGATAA TGGTCAATTG TTAATGAACA GTTAATTATA ATAACGCCCA 1380 

AAATATATTA TTATTTAATT AAGTTAAATA AAATTATAGA AAGAAAGTGA AACTTATGCT 1440 

20 TAAAAATAAA ATATTAACTA CAACTTTATC TGTGAGCTTA CTTGCCCCTC TTGCCAATCC 1500 

GTTATTAGAA AATGctAAAG CTGCTAACGA TACTGAAGAC ATCGGTAAAG GAAGCGATAT 1560 

AGAAATTATC AAAAGGACAG AAGATAAAAC AAGTAATAAA TGGGGCGTGA CTCAAAATAT 1620 

TCAATTTGAT TTTGTAAAGG ATAAAAAATA TAACAAAGAT GCTTTGATAT TAAAGATGCA 1680 

AGGATTCATT AGCTCTAGAA CAACATATTA CAACTATAAA AAAACTAATC ATGTTAAAGC 1740 

TATGCGATGG CCATTCCAAT aTaATATTGG TTTAAAAACA AATGATAAAT ATGTTTCTTT 1800 

AATTAATTAT TTACCTAAAA ATAAAATTGA ATCTACAAAC GTGAGTCAGA CATTAGGATA 1860 

CAATATCGGT GGTAATTTCC AATCAGCCCC ATCACTCGGT GGTAATGGAT CATTTAACTA 1920 

35 TTCTAAATCG ATTAGCTATA CACAACAAAA TTATGTAAGT GAAGTAGAAC AACAAAACTC 1980 

AAAAAGTGTT TTATGGGGCG TCAAAGCGAA TTCATTCGCC ACTGAATCAG GTCAAAAATC 204 0 

AGCCTTTGAT AGCGATTTAT TTGTAGGCTA CAAACCTCAT AGTAAAGATC CTAGAGATTA 2100 

40 TTTCGTTCCA GACAGTGAGT TACCACCTCT TGTACAAAGT GGATTTAACC CTTCATTTAT 2160 

CGCCACAGTA TCTCATGAAA AAGGTTCAAG CGATACAAGC GAATTTGAAA TTACTTACGG 2220 

AAGAAACATG GATGTCACTC ATGCCATTAA AAGATCAACG CATTATGGCA AGAGTTATTT 2280 

AGACGGACAT AGAGTCCATA ATGCATTTGT AAATAGAAAC TATACTGTGA AATACGAGGT 2340 

CAATTGGAAG ACTCATGAAA TCAAGGTGAA AGGACAGAAT TGATATGAAA ATGAATAAAT 2400 

TAGTCAAATC ATCCGTTGCT ACATCTATGG CATTATTATT ACTTTCTGGT ACTGCTAATG 2460 

CTGAAGGTAA AATAACACCA GTCAGCGTAA AAAAAGTCGA TGACAAAGTT ACTTTATACA 2520 

AAACAACAGC CACAGCAGAT TCTGATAAAT TTAAAATTTC ACAGATTTTA ACATTTAATT 2580 
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ACTCAGGCTT TGTGnAACCT AATCCTAATG ACTATGACTT TTCAAAATTA TATTGGGGAG 2700 

CTAAATACAA TGTATCTATA AGCTCACAAT CTAATGATTC AGTAAACGTC GTTGATTATG 2760 

CACCAAAAAA TCAAAATGAA GAGTTTCAAG TTCAAAATAC TTTAGGCTAT ACATTTGGTG 2820 

GTGACATTAG TATCTCTAAT GGTTTATCTG GTGGACTTAA TGGAAATACA GCTTTTTCTG 2880 

AAACAATTAA TTATAAACAA GAAAGTTACA GAACAACATT AAGTCGCAAC ACAAATTATA 2940 

AAAATGTTGG CTGGGGAGTT GAAGCACATA AAATTATGAA TAATGGTTGG GGACCTTATG 3000 

GAAGAGATAG CTTCCACCCA ACATATGGTA ATGAACTCTT CTTAGCTGGC AGACAAAGCA 3060 

15 GTGCATACGC TGGCCAAAAC TTCATAGCGC AACACCAAAT GCCATTATTA TCTAGAAGTA 3120 

ACTTCAATCC AGAATTTTTA AGCGTACTAT CACACAGAC 3159 
(2) INFORMATION FOR SEQ ID NO: 304: 

20 (i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 3 821 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

25 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 304: 

GCAAAAACTT TTCTCCAACT ATGTCAGACT ATAATGGCAT GAACAAAATT GATATGATGA 60 

30 

ATCAAATTAA AGTTGATACG ATGTTGCATG GTTATCACGC TGGATTTTTA TTTGCATTAT 120 

TGATTACAGT TGTTAGTTTC TTTTGTTCAT TTATGTTACA AGGTAAGAAA AAAGAAGTTG 180 

35 ATTCTCGTCA ATAAATATAA GTTGCTAGCT ATATAAAGCT TTTTAGCAAA AGTTCAACAT 240 

ATTGACTTAT CCGGCATTTC AGATTAAAAT ATTTTTATTC CGATTAGAAT AATAAGAATA 300 

AGGAGATATA TTCTATGAAA AGACTTTTAT TTGTGATGAT AGCTTTCGTT TTCATATTGG 360 

CTGCATGCGG AAACAATTCG TCGAAAGACA AGGAAGCTAG TAAAGATAGC AAGACAATTA 420 

ATGTTGGGAC TGAGGGGACT TATGCACCAT TTAGTTTCCA CGATAAAGAT GGTAAATTAA 480 

CTGGTTACGA TATTGATGTT ATTAAAGCAG TGGCTAAAGA AGAAGGTTTA AAACTTAAAT 540 

TTAATGAAAC TTCTTGGGAT TCTATGTTTG CAGGTTTAGA CGCAGGGCGT TTTGATGTAA 600 

TCGCGAACCA AGTAGGTATT AATCCTGATA GAGAAAAGAA ATATAAATTT TCTAAGCCTT 660 

ACACATTCTC AAGTGCTGTT TTAGTTATTC GTGAAAATGA AAAAGATATT AAAGATTTTG 720 

ATGATGTTAA AGGTAAGAAG TTAGCACAAA CATTCACATC TAATTATGGT AAATTAGCTA 780 

AGGATAAAGG TGCTGATATT ACAAAAGTTG ATGGCTTTAA CCAATCAATG GATTTATTAT 840 
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20 



25 



30 



35 



40 



45 



50 



55 



AAAAACCTAA 


TGcTAAGATC 


AAAGCAATCA AAGGTAATGC 


TGAACAAAGT 


AGATCTGCAT 


960 


TTGCATTTTC 


TAAAAAAGCA 


CATCATGAAA 


CAGTTCAAAA 


ATTCAATGAT 


GGCTTGAAAA 


1020 


AAATCGAGGA 


AAACGGTGAA 


TT&ClCTtk A A A 


TAGGTAAGAA 


ATGGTTTGGT 


CAAGATGTTT 


1080 


CTAAATCTAA 


ATAGCGAACA 


AC A AC AT d CXI 


CTAGATGCTG 


CAAAACAAGC 


TTTCGGACCT 


1140 


ATGCTAGAAG 


GTTTGGTCAA 


ATATTPA ATT 


CCTATTACAT 


TAGTTACATT 


TGTTTTAGGA 


1200 


TTGATTATTG 


CATTATTTAC 


A (IP ATT A ATfl 


CGAATTTCAA CGAGTAAAAT 


TTTAAGAAGT 


1260 


ATTTCACGTG 


TCTATGTATC 


Inl 1A1 JL L,<JA 


GGAACACCAA 


TGATAGTACA 


ACTATTTATC 


1320 


ATATTTTATG 


GTATTCCAGA 


A J. IAVjvjIAVjA 


TTATTAACAA ATGACGCTGA 


CAACCAATGG 


1380 


ACATTGGCAC 


CTGTAGTGGC 


TGCTATTATT 


GGTTTATCAT 


TAAATGTAGG 


TGCGTATGCT 


1440 


TCGGAAATTA 


TTCGTGGCGG 


TATTATTTCT 


ATACCGAAAG 


GACAAACAGA 


AGCTGCaTAT 


1500 


TcCaTCGGTA TGACGTATGG 


1 <_AAACGATA 


CAACGTATCA 


TTTTACCGCA 


GGCAATTCGA 


1560 


GTGTCGATTC 


CTGCACTAGG 


t TAATACATTT 


TTAAGTTTAA 


TCAAAGATAC 


ATCATTATTA 


1620 


GGATTTATTT 


TAGTGGCTGA 


AATGTTTAGA 


AAAGCTCAAG 


AAGTTGCGTC 


TACAACATAT 


1680 


GAATATTTAA 


CAATTTATGT 


GTTAGTTGCG 


CTAATGTACT GGGTGGTATG 


CTTTATTATT 


1740 


TCAATTATCC 


AAGGTATCTA 


TGAATCTTAT 


ATTGAAAGAG 


GGTATCGCTC 


ATGATTCAAT 


1800 


TGAACAATAT 


CCATAAATCA 


TTTAATGATG 


TTGAAGTCAT 


CAAAGGTATT 


GATTTATCTG 


1860 


TTGAACAAGG 


TGAGGTTGTA 


ACCTTAATCG 


GTCGATCTGG 


TTCAGGTAAA 


ACAACATTGT 


1920 


TACGTATGAT 


TAATGCATTA GAAATTCCAA CTGAAGGTAC AGTTTATGTT 


AACGGCAAAA 


1980 


CATATACATC 


TAAAGATAAA 


AAATCACAAA 


TAGAAGTTCG 


TAAACAGTCT 


GGTATGGTAT 


2040 


TTCAAAGTTA 


TAACCTTTTT - 


CCGCATAAGA 


CGGCATTAGA AAATGTAATG 


GAAGGTCTTA 


2100 


TCACAGTTAA AAAGTTGAAA AAGGATGAGG CACGTGGGAA ATCACTTGAG 


TTACTTGAGA 


2160 


AAGTTGGTTT 


AACACATGTC 


AAAGATCAAC 


GTCCACATGC 


ATTATCAGGT 


GGTCAACAAC 


2220 


AACGTGTTGC 


TATTGTCAAG 


AGCACTAGCA 


ATGAACCCTA 


AAGTGATGTT 


GTTTGATGAA 


2280 


CCAACATCTG 


CACTTGATCC 


TGAACTTGTG 


AATGATGTTT 


TAAAGGTTAT 


TAAAGATTTG 


2340 


GCTAATGAAG 


GCATGACAAT 


GGTCATTGTG 


ACACATGAAA 


TGCGTTTTGC 


TAAAGAAGTA 


2400 


TCTAATAACA 


TTGTATTTAT 


TCmTGAAGGC 


ATGATCGGAG 


AACAAGGGGC 


TCCAGAAGAG 


2460 


ATGTTCAATC 


GTCCGAAAAC 


AGAAGAATTA 


AGACGTTTCT 


TAAATGTTAT 


AAATGAAGAA 


2520 


TAATCAAATA 


GAACCACGTA 


TCATGTTTTA 


GTATGGCGAT 


GAAGCCATAT 


ACATGATGCG 


2580 


TGGTTCTTTG 


TTATGTTGTC 


ATAATCTTGG 


AGCGATATTT 


TAACGACGTT 


TATGATTTAA 


2640 
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TTCTACATGT GCGTTAAAAC CTTTTTTGAA TTGTTGGACG CCATAGTCTT CTGATGACTC 2760 

TGAAAAGTCA CCGGTAATAC CATAAAAATT ATAGCGATCA ATATGATGCG CTTTAGCAAA 2820 

5 

CTTAATCATT TCCCaCTGCA AATGGTAGGC ACCCATATAA GCATTATATT TAGGGTTTGA 2880 

ACCACTAGAT AAGTAATAAA CTTCATGCTC ATTGTAGATA AATAAAGCAG AAGCTAAGTT 2940 

TAAGACTGCA CCATCTTGTT CAATTTGTTC TATTGTATTG TCGATTTTAC GCTTATTGCT 3000 

10 

ATTTAGCTGT TGTTCTAGCT GTGTGCGTTT CGTTTTATTT TTCTTTGAAT TAGGACTTTC 3060 

TTCCAATGCT TCTTCAACAC CTGAGAGTTC AGCTGTTAAT TGTTGTTGCT TTAATTGTAA 3120 

15 CGTTTTTAAA TACTCGTTTA AATCAATATA CGCCAACTTT AACATGGCGT GGTCATCGTA 3180 

TAACTTTTGC ATTTCTTCAA AGTATGGTAA CTCACGGAAT TTGAAACCGT GCTTTTCCTC 3240 

AGCCATATGG AATAAGTCGA AAAAAGTTTG CGTTTCATCA ATCGTTAAcG TTTTaGTTTT 3300 

20 GACACCAAtA TCaTATGTtT tTtTAATATT ACGTCTCGtT TGATAATCCA TTTCTTTTAA 3360 

AAGTTGGTCT TCAGTCTTAT CTTTTAAATC TAACACTGAC AGCCAACGGA TTTGGCTCAT 3420 

TGAATCATAA CCTACAGGGA AACCTTGGTG TTTATAACCT AATTTATCCA TTGTTCTaAC 34 80 

25 

AAATGCTCGG TTATCATAAG ATTTAACAAT TTCACCGTCT GCATTGCGTA AATTTTCAAT 3540 

TAAATATGGA TCTACAAGGA CATATAAACA ATTGTGTTTC TTTAAATATG ACGTTAATGC 3600 

TTTAAAGAAA AATGCTACTA ATGATTGATT TGTATAATCC ATCACTGGCC CGCGATGTGT 3660 

30 

ATAAAAATAT TTGAAAAATT TAAGTGTGCG TGCTTCTGTC AATAAGCATC CTGCAATCAC 3720 

TTGACCATTG TCATCTTTAA CCCCTACrAG ATGCACATCG CCTTTTAAAT CAACTCTATG 3780 

35 ATTGTAATGA ATAGCTGATT GTGTGTAATG TGAAAAATGC T 3 821 

(2) INFORMATION FOR SEQ ID NO: 305: 

T (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1422 base pairs 
40 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

45 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 305: 
GCGACACCAT TGTTTGCAGC AACTGTTAAT TTACCAGTTG ATGGTTTCGA CGGTGTTGTT 60 
so GGTTTTGATG GTGTAGTAGG GGTAGTTGTA GATTGCGTAC CCCATGGCGC CACTTTACCC 120 

ATTTTTATTA AATATTTTTC ATTAATTAAG TCATATAATT GATCATAACT ATAATTATGA 180 
CTTCTTAAAT ATCCATGTGG ATcGGCATGG TCAGTACCAC CTAAATATTT ACTTACAGCG 240 
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5 



10 



15 



30 



TATTGTAATT 


GTGTAGCTGC 


ATAGTCAGCA 


TAGTTATTCA TTGAACGTGC 


AAATGAAGCA 


360 


TAGTCGTGTG 


TGTGTACGAT 


TTCAACATTG 


ATGAATCTAG 


GGTTACCGAC 


TGCACCGACA 


420 


CCCCAAGATA 


AGTAATCCGT 


TGGTGCTGTT 


TCGATTATAC 


GATCCCCATC 


AACAAATGCA 


480 


TGTACGAATG 


CGTTTTGATA 


GTTATTTTTC 


ATATAACTAA 


TTTCACCATT 


TATCGTCGAA 


540 


CGATCATTAG 


CTGTATCATG 


AACTACGATA 


CCTTCAGGAC 


GACCTACGCC 


GTTACGGTAT 


600 


GCGTATTTAG 


GGAAGTAAGA 


TGTATAATCT 


TCTTCAATTT 


TAGGTGCTTT 

X «^S*N* X 4 X X 


TAAGTTATTT 


660 


TTACAAATGT 


AATCGTTAAT 


TGAAGAGTTT 


ACTTGTGGTT 


TATATTTTGfi 
xnxnx x x iuu 


CAAACTCGTT 


720 


TTTGGTGTTG 


CAGCAACTGA 


TCTTGGTTGT 


GCTGAAGCGC 


TAAAAGTAGT 


TACTTTAGGT 


780 


GTCGCTTCAG 


TTTTAGCTTT 


AGGTGCTGAT 


GTAGTTGCAG 


HTTT A G/^'PfZ/"* 

^- X X l/VJ\JlkJV 


TGCGGTTTTA 


840 


TATTGCGTyT 


CAAGAGCTGC 


AGGTTTAGCA 


VJ\» X >*rt X X AAA 


x xnnx x l vjiy 


ATTAATTTGA 


900 


TTTTCTGAAT 


TATCATCTTC 


ATCATCAACT 


AAA CT AT A AC 




AACATTAGTG 


960 


TTAGTTTTAG 


GTGCTGTAGT 


GCTTGTTGAC 


TTTGCAACAG 


vj^. X VJV-VJ X A X 


ATTTGTAGTC 


1020 


GCTGATTGAT 


TAGCACGAGT 


GTCACCATTT 


ACTTGTGCAG 


TATCAACTTT 


TTGACTTACT 


1080 


TGAGCATTGC 


CTGTTTTGTT 


ATTTGCTGTT 


TTTGGTTGGA 


CAATAGCAGG 


GTCTTGATAT 


1140 


ACTTGAGTGC 


CAGAAATGTT 


TTGCGTTGGA 


TTTTTTACCT 


CAGCTTTTGC 


TTGTTCAGTA 


1200 


GTTGCTTTAA 


CTTTATTACT 


ATCTAAAACG 


TTTTTATTAG 


TAGTTTGATC 


TTGTGTCGTC 


1260 


TCAGCTGCTT 


GAACTTGATG 


TGCAGTGACT 


GCTGAACCTA 


CAAGCGTTAA 


TGCAACCATT 


1320 


GAgGTAGTTT 


GTAATTGAAT 


TTTTTCGCCA 


TTCTATTTAT 


TACTCCyAAC ATTTATTAAT 


1380 


TATtACTAAC 


ATTATAGTAC 


CTGTnTTATA 


TACCTGTGCG 


TA 




1422 



(2) INFORMATION FOR SEQ ID NO: 306: 

~(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6076 base pairs 
40 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 

45 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 306: 

ACGCGTTGGT TATTTCAATC ATAATATTAC TCTGCAAATA CACAGCCCTG TAACCGAGTA 60 

AATGGATAGA GATTTGAACA AATGAAAACA ATCAACTAAT GGAAAGGATA AAATATTATG 120 

50 

' ' " ' CACAACAATA ATGAATTCAA CAAAAAACTG AAAGATTTTA TAGGTAGCGA TAAACGGATG 180 

GCTTTAGTAA AGGGTTATGT TAACGAGTAT AAATTAACAA CTGTTTTAAG AGCTTTAAAT 240 
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GTAGATAATC GAATTATTCC TAAAAATATA ACTCAAAACA CAATCTTCAA ATTGAGTAAT 360 

TTAACCTTAG AGGTTAACCT CTATGAAAGA AACACAATTT ATCACGGAGA CTTTGCTATT 420 

TACTATCCTG TAGAATCTGC TCTAATAATA GAAACAGATA CTCCTAGGCT AATTAATCAT 4 80 

ATAAATAACA ACCCAGTCCA AAAAATATTT ATAATAACAA CAAATGACTG GAGCTTTAAT 540 

ACACTTGaAT TAGAAAAAAT AGTAGACGAA ACTATAATTT ATGATTTAAA ACAAGAAGAT 600 

CCTAAACAAT ATGAAATTTT ATATAAAAAT AAACACGGAA AATTGCCTTA TTGATGAATT 660 

AAAACGCAAA CTTAGAACAC CTTACCCCTT TTCCGTCCTT ATTGTAATTT TCCAACTACT 720 

1S CAAATTAAAA ACCACCCGTG CAAACAGGTG GTTTTATTAT ATATAATTAT TCCCACTCAA 780 

TTGTGCTTGG TGGTTTTGAT GTAATGTCAT AGACTACGCG GTTGACGTGA TCTACTTCGT 840 

TTACGATACG ACTAGAAATC TTTTGTAAGA CTTCCCAATC GATGCGTGCG AAGTCACTTG 900 

20 TCATACCGTC GATAGATGTT ACTGCACGAA TACCTACTGT GTGATCATAC GTACGGTAGT 960 

CTCCCATAAC ACCTACTGAT TGAATGTTTG GTAACACTGT GAAGTATTGC CAAATTTCTC 1020 

TTTCAAGACC TTCTTCTCTA ATCACTTGGC GTAAAATCGC GTCTGATTCT CTAACGATTT 1080 

25 

CTAGTTTATC TTCAGTAATT TCTCCAAGTA CACGAATACC AAGACCAGGT CCTGGGAATG 1140 

GTTGTCTCCA TACTAAATGT TCTGGAATAC CTAACTCAAT ACCTAATTTA CGTACTTCAT 1200 

CTTTAAACAA TGTATTGATT GGTTCGATTA ATTCGAATTC CATGTCTTCT GGTAATCCAC 1260 

30 

CAACATTGTG GTGTGATTTG ATTGTTTGTG CTGTTTTAGT ACCTGATTCG ATGACGTCTG 1320 

TATATAGTGT TCCTTGCGCA AGGAAGTCTA CACCTTTCAG TTTTGATGCT TCATCATCAA 1380 

35 ATACGTATAC AAATTCATTA CCAATGATTT TACGTTTTTG TTCAGGATCT GAAACACCTT 1440 

TTAATTTATT CATAAAGCGA TCTTTCGCAT TAACACGAAT AATATTCATG TTGAAACCTT 1500 

CACCGAATTG CTCCATAACC ATGTCGCCTT CACCTTTACG AAGtAAGCCA TGGTCTACAA 1560 

40 ' AGATACATGT TAGTTGATCA CCTATTGCTT TATGCAATAG TACAGCTACA ACAGATGAAT 1620 

CTACGCCGCC ACTCATCGCA CATAATACAC GACGGTCTCC TACGCGTTGA CGAATCTTTT 1680 

CAATTTCGAT TTCGATAAAG TTTTCCATTG TCCATTGACC TCTACAATCA CAAACACGAC 1740 

45 

GGACAAAATT ATTTAATAAA TCATTACCAT ATTCTGTATG ACGTACTTCT GGATGGAATT 1800 

GAACACCATA AATGCGACGT TTCTTATCTT CGATTGCTGC ATAGTCTGTG CTTGGGCTAT 1860 

CAGCGATAAC TTCAAAGCCT TCTGGAATTT CAATAACTTT ATCAGAATGA CTCATCCAAA 1920 

50 

CAGTTTGTTC TGCTGGTAAG CCAGCGAATA ACTCATCTGA CTTCGCATTA ATGATTGCTT 1980 

TACCGTATTC ACGTTCATTG GCACGTTCAA CTTTACCACC TAATAATTTA GTAGTTAATT 2040 

55 



1143 



EP0 786 519 A2 



10 



TAAATGAACC TTCTTCATAA ACTGAATTTG GACCACCTGA TAAGATAATA CCTTTTGGAT 2160 

TCATTTTCTT AATTTCTTCA ATTGAAATTT CATGATCGTG TAATTCACTA TAAACGCCCA 2220 

TTTCACGAAT TCGGCGTGTA ATTAATTGGT TGTATTGGCT ACCAAAGTCT AAGACAAGGA 2280 

TTAACTCTTG TTCTTTTGCC ATTTCCATAT TTGTCGTTCT CCTTTATCTT AATTAGAATG 2340 

AGTAGTTCGG TGATTCTTTC GTAATTTGAA TATTATGTGG ATGGCTTTCT GCTAAACCAG 2400 

CAGGACCCAT ACGTGTAAAT TGTGCTTCTT CGCGTAATTC TCTTAAATCG TGTGAACCAG 2460 

TATAACCCAT ACCAGCACGC ACACCGCCCA TTAATTGGTA AATTGTATCT TGTAACGCAC 2520 

75 CTTTATAAGC CGTACGTCCT TCGATACCTT CAGGAACAAA TTTCTTAGGC GCTTTGTCCT 2580 

CTTGGAAGTA ACGGTCGTTT GAACCTTTTT CCATCGCACC TAAAGAGCCC ATACCACGGT 2640 

ATACTTTATA TTGTCTACCT TGGAAAATTT CTGTTGCGCC TGGGCTTTCT TCAGTACCTG 2700 

20 CTAATAAGCT ACCTAACATA ACCGCATGTC CACCAGCAGC TAATGCTTTA ATGATATCTC 2760 

CTGAGAATTT AATACCACCA TCAGCAATGA TAGCTTTACC ATGTTTGCGT GCTTCAGTtG 2820 

CACAATCATA AATTGCTGTA ATTTGTGGTA CACCAACACC TGCTACAACA CGCGTCGTAC 2880 

AAATTGAACC TGGGCCAATA CCAACTTTAA CAATATCTGC ACCCGCTTCA AATAAATCTT 294 0 

TTGTTGCTTC TGCAGTTGCT ACGTTACCTG CTACTAATGT GATTTCTGGG TAAGTCTTCT 3 000 

TAATATGTTT CACTTGATCG ATAACACCTT TAGAGTGACC ATGTGCTGTA TCGATAACTA 3060 

AGACATCCAC ACCTGCTTCG ACTAATTTTT GAGCACGAAT ATCAGTATCT TTTGAAATAC 3120 

CAATTGCTGC GGCTACAAGT AGACGACCAT GTTCATCTTT TGCTGCATTA GGGAATTCGA 3180 

TAACTTTTTC AATATCTTTA ATAGTAATAA GACCTTCTAG ACGTCCGTCT TTAACTAATG 3240 

GTAACTTTTC AATCTTATGT TTTTGGAGAA TTTTTTCTGC TTCTTCAAGT GTTGTATTCA 3300 

CTGGAGCTGT AATTAAATTt TCTTGCGTCA TTACATCTAC AATTTTAATC GAGAAGTCTT 3360 

40 CAATAAAACG TAAGTCACGG TTTGTTAAAA TACCTACTAA GTTGCGATCT TCTTTATTAT 3420 

CAACAATTGG TACACCTGAA ATACGGTATT TACCCATTAA TGCTTCTGCT TCATAAACGC 3480 

, TTTCTTCTGG CGTTAAGAAA AATGGGTTTG AAATGACACC ATTTTCTGAG CGTTTTACTT 3540 

TTTGAACTTC GTCCGCTTGT TCTTCAACGC CCATATTTTT ATGAATAACA CCTAAACCAC 3600 

CTTGACGAGC CATAGCAATC GCCATTTTAG ATTCAGTTAC AGTATCCATA CCAGCAGAAA 3660 

TAACTGGAAT ATTTAATTTA ACTTTGTCTG ATAATTGTAC GCTTAAATCA ACGTCTTTCG 3720 

GTAAAATATC AGATTGTGCT GGAATTAATA ACA CAT CATC AAACGTTAAT GATTCTTTTG 3780 

CAAATTTACT TTCCCACATT AAAAACAGCC TCCATTTTTC AAATTAATTA GTTATATTAT 3840 



2S 



30 



35 



45 



50 



55 
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GCAGAGATTG CGCCTAAAAC AATTCCGTTT TGAGTCAACC ATGCAAATTG TTCACCTAAA 3960 

CCTTTAAATG CTTGTGGTAC AGCGCTTATA CCAGTACCTA AtCCTACTGA TACAGCGATA 4020 

5 

ATTAATAAAT TGTTTTGATT TTTAAAATCG ATATGTCCTA ATATACTAAC ACCATATGCC 4080 

ATTACCATGC CAAACATAGC TATCATCGCA CCGCCTAACA CAGGTAGCGG TATGATATTT 4140 

GCTAATGCGC CAAGCTTAGG TATACAACCA CATATAAGTA ATAACACGAC CATGCCGTAT 4200 

10 

ATAACATTGT TTTTCTTAGC GCCGGATAAA GAAACAAGTC CTACATTTTG CGAATAGGCT 4260 

GTATACGGAA ATGAATTGAA TATAGAACCT AAcACTATCG CTAGACCTTC CGCAGTATAA 4320 

1S CCTTTACGAA AATCTTTTCT TTCTAACTTC TTACCGGTAA TTTCACTTAA CGCATGATAG 4380 

ACACCTGTCG ACTCAATTAA ACTAACGATA GCTACAATAA AGAACACTAA CGTCGATGTC 4440 

ACATCAAAGC TAAATCCAGA GAATCTAAAC GGCACTGGGA TGCCTAACCA ACCGGCATGA 4500 

20 TTGACTTGAT TAATATCGAC CATCCCAAGT AAGCCAGCAC CTATCGTTCC TAAAACGAGT 4560 

CCAATTAATA TGGCAATACT CTTAATAAAT CCAGTTGTGA ATCTTTGTAA AAGAAGAATA 4620 

ATGATTAATG TCATTAAACC TAACAAAATG TTCTTAACAT CTCCATAGTC CTTTGCACCT 4680 

25 

TGACCTCCAG CTAAGTAATT CATTGCTACT GGCATTAAAT TGATACCAAT GATAGTAACA 474 0 

ACACTACCCG TTACTACTGG TGGGAAGAAT TTTACAAGAT GTGAAAAGAA AGGCGCGATG 4800 

ATAATAACTA ATATCCCTGA TAAAAATAGC GAACCATAAA GTACATCTAT TCCTTTCGTT 4860 

30 

TGACCAATTA AAATCATGGG CGCAACAGCC GTGAATGTAC ATCCAAGAAC GATTGGTAAT 4 920 

CCTGTTCCTG TTACTTTATT GGCTTGTAAA AATGTGGCAA CCCCACACAT AAATATATCT 4980 

35 ACTGTAACTA AGTAAGCGAT TTGTTCAGGT GTAAACTTCA AACTTGTACC AACAATGATT 5040 

GGAACTAAGA TAGCACCTGC GTACATAGCT AAAAGATGTT GAACACTTAG GATTAAATTT 5100 

TTCATTATTC TTCTCCCACC AATGTCACTT TGTTTCCTTC TAGTGAAGCA ACCTTGCAGA 5160 

40 GAGAAGAAAC TGTTAAACCT GCTTCTTCTA AACGTTGATG CCCATTTTGG AAACTCTTTT 5220 

CAACAACAAT ACCAATACCA GCTGTCTTAG CATTCGCTTG CTGTGCGATA TCGTATAATC 5280 

CTAATGAAGC ATCACCATTT GCTAAAAAGT CATCGATGAT AAGTACAGTA TCTTCTTCTG 5340 

45 ATAAAAACTC TTTTGAAACA ATGACCGTAC TTGTTTTATT TTTAGTAAAT GAATGAATAG 5400 

ATGTTTCATA ATAACCATCC GTCAAAGTGC TAGGTTTTGC TTTTTTCGCA AATAAACATG 5460 

GCACATCAAA ATGCAGTGCA GCCATGATTG CAGGTGCGAT ACCGGAAGCT TCAATGGTTA 5520 

SO 

AGATTTTAGT AATCCCTTTA TCTTTAAATT GCTCGTAAAA AGTGCGACCA ACTTCATTCA 5580 

TTAACTTTGC ATCAATTTGA TGATTTAAAA ATCCATCGAC TTTTAAAATC TTCTCATCAA 5640 

55 
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ATTTGTGTGA AACATTTTGC TCTTAAATTG GTGCTAGATA CAAAAAAATC CCCAAACTAA 
ATAATAGTTT CAGGG TTTAT GAGTGAACGa ACATGCATAA CGAATTTGTC ATGCAATCAA 
TGTAAAAGAA GTTTCATCAA ATAAACTGTG ACCATCATAT AAAATGATAT AAATCACCCA 
CCATGGTTAC AATTTAATGG CTGAAGCTAC TCCTAGTATT GTGTTGTTAC TCATAGTCAT 
GTCGTTCAAG GCAACATGGT AGAAACTTCT AAAGCCATAT TCTTTAGATT ATATGAGTTT 
ATGTAAATTA TTTAACGATA ATAGCAAATT TTCGGCATTT TTTCAATAAC TGCTTAGGTA 
ATCTTTTAAT AGTTTT 

(2) INFORMATION FOR SEQ ID NO: 307: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6136 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

{xi) SEQUENCE DESCRIPTION: SEQ ID NO: 307: 
ACCGCCGATT GATAGCTTTA CTGCTGCGAT AAAACTGCCT TCAACAATTG GTGCATCAAC 
TTTTAACACA CGATGATTAC CATCATACAT TTCAATTGCC ATATCTACAT TCATTTCTGA 
AGATCCAATA TCGTAAAAAC ACAATGCATC ATCCTCTAAT TTAGTCAAAA CTTCTTGGAT 
GATATCAAAT GAAGTTC CAA TTGAACCATC TGGTAATCCC CCGATTGGTA TAATATCAAC 
GTCACCTGCC ATTTGCTTTA ACAAAGATTT TGTACCACTT GcAATTTCTT TACTGTGGCT 
AACAAGTATA ATTTTAGGCA TTATCTTCAT CTCCAATCAA AGCGTTTAAA ATATAAACCA 
TACTTTGAGC ACCTGGATCA ATATAACCTT TTGATTCTTC TCCAAAATAT GCAGCTCTAC 
CTTTCGTTGC TACCATATCT TTTGTATTAT CTGCTAATTG CTGTAAATCA TTGAATGTTA 
AAGTTTCACC ATTTTTAAGC TTCTCTGCTG CTCGCGCTAC TACATCATAC ATTGTCTTTT 
CATTTAAAGT AACTTTACCA CGTGATTCAA CCGCTTCGGC AAATGCCTGA ATTAGTGTAA 
TGAAATCTTG ATTATCCATA TCATCTTTGG TGACTGCAGA CATTTTAACA AAGCTAAAGC 
CATACAGTGG TCCTGATGCA CCCCCAACAT TTGACATCAA TGCCATACCA GTTGATTTGA 
ACAATGATTG CATTGAGCTA TCATCAAGTT TGTCTTTAAG ACTACTAAAC CCACGAACCA 
TGTTAACCCC GTGGTCACCA TCACCAATTG CTCGATCTAA TTCAGTTAAT TCAGATTCAT 
GTTTTTTAAA CGTTTCTTCT AAATTTAATA AACGTGCTTT CATATCATTC ACTTTCATTT 
GTGCCACCTC ATAAATGTAT ATTTATTCAT ATTCACTTCT TATTTAAAGT ATTGACTTGT 
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ACCTTGCATG TCTAAAGATG TCATATAATC ACCAACAAAC CATTTAGCAA CATTAACCGT 1080 

TCTTGCAGCT AAATTTTGTT GAATATATTT AGTTACGATA TTTAATTCAG ATAACGGCGT 1140 

ACCACCCATA CCATTTACCA TTAATATGAC ATCATTGGCA GTAACTTCTT TATACAATTC 1200 

GTCTAACAAT GTTCCAACAA TATGATCAAT ATCCTTTACT TCTTCCCTAT GAATACCTTT 1260 

TTCACCATGT ATACCAATAC CGATTTCCAT TTTGTCGTCT TCAATATCAA AGCCATATTT 1320 

TCCAGTAGTT GGAACAAGCG GTGGCTCAAT TGCCATACCA ATACTTTTAA TTTCAGGTAA 1380 

CAACGCTTCT ACACGCGATT TTATCTCTGT TAATGAATAA CCTTTTTCAG CAAGATAACC 1440 

1S GGCAAGCTTA TGAACAAACA CTGTTCCTGC AACACCACGA CGTTGTACTT CGTTTGTCAC 1500 

AGCAATGTCG TCACGAACAA TAACAGTTTG AACATTTATA CCTTCCATTT CTGCAAGCTC 1560 

TTGTGCCATT TCGAAATTCA TCACGTCACC TGCATAGTTT TTTACAACTA GTAATACACC 1620 

20 ATCACCAGTA TCTACTGCTT TAATAGCTTC TAATATTTTA TCAGGTGTAG GTGATGTAAA 1680 

TACTTCGCCA CAAACCGCTG CATCTAGCAT ACCTTCTGCA ACAAAACCGG CATGCGCAGG 1740 

TTCATGTCCG CTTCCACCTC CAGAGACTAT TGCTACACCA TGTTCTTTCT TAGCTTTTTT 1800 

TACAATAACT GTATTAGCAA TCAGATCTAA CTCTGGGTGC GCAATTAACA ATCCTTCAAG 1860 

CATATCAGTT AAAAATGTTT CTTTTTTATT GATTAACTTT TTCATCATGT TGTACCTCCT 1920 

TGGTATTATC AGTCATAGTA TAAAACAGAA TAAATGAATG CGCTATCATA AAGAATTAAC 1980 

CTGATACCGT TATCAAATAT ATTTTTGATA AGATCCTCTT GATAACTTAA TGGTTCATTA 2040 

TTGAAAAAAT AAATAGTCTT GAGTGGCTCA TTAAATAAAA AATGCTATGA AAAGCCTTAT 2100 

AATAAAGTGC CTTTCATAGC aATAAGTTGT GTCCATTGAC ACTATACATT TTTCGTTTTG 2160 

TACATTAAAT ATAAGAAATA CGGTGCACCA ATAATTGCTA CGACAATACC TGCTGGAACC 2220 

CCACCTGGTT GTAATACAAT TTTGCCAATT GTATCAGCTA TAACAAGTAA ACATGCCCCT 2280 

40 ACTAAAATGG CAATTGGTAA AAACAACTGG TGACGTGGTC CAACGATACG TTTGGCAATA 2340 

TGCGGACCCA TTAATCCGAT AAACGAAATT GAACCTGCTA cTGCTACAGC AGCAGATGAT 24 00 

AACATCACTG CGATAAAGAA TAATATTAAA CGTTCTCTGC TTAACCTTAC ACCTAGACCT 2460 

CGTGCAATAT TATCACCCGT ATGAATAATA TTTAGTGTAT TCGATTTAAA TAGTAAGTAA 2520 

GGAATAATAA TCAACACCCA CGGTAAAAAT GCAATGACAA ATGGCCATTC GTCACCCCAA 2580 

ATATTACCTG CAAACCAAGC AGCGATGAAA TCAGATTGCT TATCATCAAA TTTTGACATA 2640 

ATTGTAATTG AGCCACCATA TAATGCTGTT TGTAAACCTA CACCTATTAA TACCATACTC 2700 

GCAGGTGTAA CACCTTCATT TTTATTAAAA CTGaAAATAA AAATAATCaA TGCAGTGgTG 2760 

55 



25 



30 



35 



45 



50 
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10 



15 



20 



25 



30 



35 



45 



SO 



CCAATTGCAA 
GTTCAGCTAT 
CCAGCCAAAA 
ATGGCATCAC 
CCTGAGGTAA 
ATCAATTGTC 
AATATAAAAA 
AATATCGTGC 
GTAGAATTTT 
CTACAAATGC 
TTAAACATAT 
CAAGATTTAA 
TTAATGGAAT 
AAAATGTTAC 
ACATAGCACT 
TAGATCGGCC 
ACATCAATAT 
AAGCACCTGA 
GTATAATCGC 
GAATCCTAAT 
CCTCTATAAT 
TGATTAGTAG 
TCTCTCTATT 
AGCTCTGCGA 
TAAAACAACA 
TGAACCTGTA 
CGCTTGGTTG 
CTGAACTAAT 
TAAAAAGATA 



TAAATAATGC 
TGGATTTTTT 
TAGTAATCAT 
CTTGTCCAAT 
TACTCCAAGT 
TGCGTTTATT 
GTAAGGAACA 
TATCACATCG 
AGCATAATCA 
AACTTGTCCA 
GCCTCTGATC 
AATGGTAAGT 
TGCCCACTTA 
TGTTTGATTT 
TACTGCTGCA 
TATCATTAAT 
TAAAAATGAA 
ATTTAAACCT 
ACCAGAAACT 
CTCATTGATG 
TGTAGAGGCT 
TATCATACTT 
TGTCATGTTA 
CATAAGTCAT 
TCAATATTAA 
GCGATGATAT 
ATATCATGAA 
TCTAGTATTT 
ATATCAGTTC 



GATTGCAAAT 
GTGACACTTT 
CATCCGAGGT 
TAAAGTTTTG 
ACAACCTAGA 
ATTTGAACTA 
CCGATAAATG 
GCAACAAGCA 
GTTCCAATTA 
GCGATAGCAA 
ATTGTTACAT 
TGTTTACTAA 
AGGTGTGACC 
AGTCTAAAAG 
CCCGCTAAAA 
ACAATAGCAC 
GTGTTTGGTA 
ATGAGCGCCG 
GCAAGCGCCA 
ATGTTTTGCT 
TGAATTTTGG 
AAACCTATAA 
ATTGTCCTTT 
AAGTTACCAG 
AAACTTTTTC 
CCCCTTCTTT 
GAACCATGAC 
CTAATTGATG 
TTTGTGCTAA 



CCGCCACtGC 
GCACTATTGC 
AACCTGAAAT 
AAAAATCTTT 
AATAGTAGAA 
ATCATATTGA 
AAATGATTGC 
CGAGTATCCC 
AAAATCTTGC 
CTGCAATACC 
TTTGACCTAA 
TTGTTAATAT 
ATGTTGTGCC 
CTAATGCAAT 
TAATACGCAT 
CTCCTAGAAT 
AAACTGCATA 
GATCAGCAAG 
TACCTACAAT 
GTTGATTGCT 
CGTCACCTAT 
TATAGGATAA 
TTATCATATT 
TAAAGGTTTT 
TAATATTTCC 
CATCGCAATA 
AATTGTACAA 
ACAGATATCT 
TGCCATTGCA 



GTTAATACCT 
ACCACTAATA 
CTAATAAGAT 
CAACAGGTAT 
TGCTAAAAAC 
GCGTCCTCCT 
ACCAACAGGC 
ACCTAACAAG 
TATATGAGGT 
TGCTAGAATC 
ACCTTTAGCT 
AATGAATAAC 
TGAAACGCCT 
ACCTTGACTT 
CGGATTAAAT 
AGCACCTAAA 
TGTTAATGCT 
ACCATTACGA 
TACTGCTGCT 
AGGATTATAA 
TAATGTAGAA 
AAACTTCAAT 
AACTTACTTA 
CCAGTTTTAG 
TGTGTTAATA 
AGATGATCTG 
CCTTGTTCCT 
AAATATGTTG 
ATCCAAACAC 



AATATACCTG 

CTAAgCtGCG 

TAACTCATCA 

GTTGTATTCA 

AGCCAGTGCT 

TTTTTAACTA 

GCTTCTCCTA 

GCTGTTAATG 

ACCATCAAAC 

ATAGCAATAA 

AATGATTCAC 

GCAATACCAA 

CCAGCAGTCC 

AGCGCTGTTA 

CCATCACGTC 

AATCCAGCAA 

AAAGCAAATG 

GTAACACCTT 

ATATTTCTGG 

TTAAAAATAG 

ATAAATAGTG 

GGCGTTGGGT 

ATTAAGAATA 

GATCTTTACT 

CGTCTTCTGT 

AGAAACGAAT 

GATTTAGCTT 

TTGGTTCGTC 

GTTGTCTTTG 



2880 

2940 

3000 

3060 

3120 

31B0 

3240 

3300 

3360 

3420 

3480 

3540 

3600 

3660 

3720 

3780 

3840 

3900 

3960 

4020 

4080 

4140 

4200 

4260 

4320 

4380 

4440 

4500 

4560 
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TGCCCAATCA ATtTCTTTCT TAtCCTCAGC AgTTAATCTA CCAAATCCTT TTTGATGTGG ' 4680 

AAAACGACCA TATGAAACTA ATTCCCCAAC AGTTAAGCCA TCTGCTACTT CaGGTGaTTG 4740 

5 

aGGTAAAaTG GCtATTTTTt TGcAATCyCy TTCGTAGATt GTGtATGAAT ATTTTCACcA 4 800 

TCTAAAAATA CTTCGCCTTC TTTAACTGCC AATAAACGTG ACAATGCCTT TAGCAAAGTA 4 860 

GATTTCCCGC AGCCGTTAGG ACCAATGATT GACGTCACTT TGCCATCTGG TATTTCAACA 4 920 

10 

TCTAATTTAT TTATAATCGT GTTATCCCCG TAACCAATTT TAACTTGTTG TCCATGCAAA 4980 

CGATTCATAA TTTCCCTACT TTCAATAAAA TTCTTTCTGT TTATAAAAAA TAATTTCTAT 5040 

1S TTTTAAATTA TCAATTTTCA AAGACATCCC AATTGATAAT GATTATCATG AACATCATTA 5100 

TAACATTTTT CAATCTTATT GACTAACATT ACTTTTTAAA TTGGATAGCT CGATTTGTCA 5160 

TGTCTTGTAT ATTACTTTTA TAAAATAAAA AACGCCCACA GATAAGTCTT CATAGTTCAA 5220 

20 AAACTTGTCC GTGGACTTCT ATTTAAGTAT GTGTGCTCAT ACCATTTATT TATTCATCTG 5280 

CAAGAAAGCC - ATTACCATAG ACATCTCTTA CATCATGAAT TACGAGGAAT GCATCTTTAT 534 0 

CGATTTGTTT AATTAATCGC TTTGCTTTTG AAACTTGTGT TTTAGAAATA ACAACGTATA 54 00 

25 AGACATCTTT TTCTTCACGC GTATAATAGC CATGTCCGTT TAAAATGGTT AAACCTCTTC 5460 

CAATTTGCTC GTCTATTGCT TTGGCAAGTT TGTCGGGATT AGTTGAAATA ATCGTCATAG 5520 

CTTTTTTAGT GTTTAAACCT TCTATGACAT ATTCCATCAC TTTTGTTCCT ATATAAAGTG 5580 

30 

ATATTACTGT TACTAATACT TTATCAAGTG GAATAACTGT AAGTGAAATT GCAACAACGA 5640 

T CAT AT CG AA GAAAAGCAAA GCATATGGCG TGCTTACATC GAGGTATTTC GTTGCAATTC 5700 

TCGCCAAAAT TGTTGTACCT GCTGTTGTAC CGCCTGCAAG GATAATTACT CCGATTCCTA 5760 

35 

GTCCAACGCT TACACCACCA AAAATGGCAT TCACAATGCT GTTTCCAGTT TCTACTTGCC 5820 

ATGATTCTGT TAAACTCAAA AATATTGAAA TAAGAATTGT TACAAGAATA GTTAAGTACA 5880 

40 TACTTCTCTT ACTCAAAAAt TTATAAcCTA TGGCAATCAA TACTGCGTTG ACCAAGAAGT 5940 

TAGTGATGGC TGGTGAAATA TGAAACGCAT AATATAAAAT AATTGCTAAA CCTGTAACCC 6000 

CGCCTTCACC TAAGTTACCA GAAAT^ATAA ATGCATTTAC ACCTGCAGCA AAGATAAATG 6060 

45 AACCTAAGAC AACTAGTATT AAATCTTTAA CCGTTTTATT CACGAAACCA TCCCCTTTAT 6120 

ATATTTATTA GACTAT 6136 
(2) INFORMATION FOR SEQ ID NO: 308; 

50 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2576 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
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10 



15 



20 



25 



30 



35 



40 



45 



50 



55 



(xi) 


SEQUENCE DESCRIPTION: 


SEQ ID NO: 


308: 






GATATCGTAs 


CTACTGAAAA 


GTCATCACCA 


CCATGGAATG 


ATTTCTTTAA 


ACGTTTTAGC 


60 


TTCTATGCAA 


TTGCAATTCA 


ATACTTTGTT 


GTACAATTTA 


TCATTACATT 


ATTCTTAATT 


120 


TGGTTACCGA 


CGTATTTAAC 


AGAAGTATTC 


CACGTTAACT 


TTAAAGAAAT 


GAGCATTAGT 


180 


TCATTACCTT 


GGTTATTAAT 


GTTCTTCTTA 


ATCTTATCAG 


CAGGTGCAAT 


TTCTGACCGT 


240 


GTATTAGGAT 


TAGGTCGTTC 


AAAATTCGTA 


GCTAGAGGTG 


TAATTGCAAT 


TGCAGGATTT 


300 


ATTGTGTTTG 


CAGTTTCAAT 


TATCTTTGCT 


GTACGCACAG 


GAAATTTATA 


TGTAAGTATT 


360 


TTCTGGTTAT 


CACTAGGTCT 


TGGTGGTATC 


GGTATTTCAA 


TGGGTATGAG 


TTGGGCTGCA 


420 


GCAACTGACT 


TAGGACGTAA 


CTTCTCTGGT 


ACAGTATCAG 


GGTGGATGAA 


CTTATGGGGT 


480 


AATATAGGTG 


CATTAATCAG 


TCCGCTATTA 


GCAGGTCTAT 


TCGTAGAACA 


TTTGGGTTGG 


540 


ACAATGACAT 


TCCAATTGTT 


AATCGTTCCA 


GCAGTAATCG 


CTGTGATTAT 


GTGGTTCTAT 


600 


GTGAAACCAG 


ATCAACCTTT 


AATTGTTAGT 


GATGATAAAG 


CAATAGAAAA 


ATAATTTAAA 


660 


CAAGCAGTAA 


GCTTTCACAT 


AGTTGGGGCT 


TATTGCTTTT 


TTTGCGTTGA 


AATTGAAACT 


720 


TTTTAAAACA 


GATATGGTTT 


AAGATGAAAA 


TGAAGTTATT 


GAAATGATAT 


ATGTAAAGAA 


780 


ATAAGGTTTT 


AAAACATTAG 


TCAGGTAACG 


CTTGTaAAAG 


TACATATAAA 


TTTTAACTAG 


840 


CGCAAAGGTG 


GGCGACCAAA 


GtTcAACGAT 


GTTAAATAAC 


aTTAGrAATT 


AATTTTAATT 


900 


GGACTTTAAA 


AGTTTTTAAA 


TTTAGATAAT 


TGAGCATAAG 


GTGTTATAAT 


GACATATGTT 


960 


GCGTAATTAA AATTTATAGC AACAAATTCA 


TTTTAACTAT 


GCTAATAAAA AGATTATGGA 


1020 


AATATTTTGA 


CAAGGAAAGG 


AGAAGTCGAA 


ATGACATCTT 


TTTGACATCA 


CTCATAAAAA 


1080 


TCAAtCGACT 


TAACTTAGAC 


TTTTATAAAG 


GTGTAAGACA 


GGGACTGTTA 


ATGATTATTC 


1140 


CTGCAATAAT 


CGGTTACTTA 


TGTGGTAATT 


TCCAATTTGG 


ATTATTAGTT 


GCAACCGGAA 


1200 


CACTAGCCCA 


TATTTATGTT 


TTTAAAGGTC 


CGTCGCGATC 


TAAGCTGCGA 


ACTGTAATAA 


1260 


TTTGTAATTT 


AGCGTTTGCA 


ATATGTATGA 


TGCTTGGTAC 


GCTAACAGCC 


AAAACGCCAC 


1320 


TCGTTTTTGG 


AATGACATTA 


TTAATTGTTA 


CGGTTATACC 


ATTTTATATA 


TTTACTGCCT 


1380 


TAAAAATAGC 


TGGACCGTCA 


TCGACATTCT 


TCATTGTGAC 


ATTCAGTCTA 


CCCATTAACT 


1440 


TACCTATAGC 


TCCCGAAGAA 


GCATTATATA 


GAGGCTTTGC 


GATTTTAGTA 


GGCGGTATAC 


1500 


TTGCCACTAT 


GATGGTGTTA ATCACGATCG TATTTTCTAA AAACAAAGCT GAAGAACAAG 


1560 


CAATTCAAAA 


TGATTTTAAA 


CTCATATCTA 


AGTTGTTACA 


CACTTATAAT 


GATAAATCTG 


1620 
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TCACTTCTAC TTCAAGTAAC GATAAATTAA GTAGACGTTT CCAAAAATTA TTATTATTAC 1740 

ACACATCTGC CCAAGGGATT TATTCTGAAC TGTTAGAGTT GAACGCTAAA CAAATTCGAC 1800 

CATTGCCAGA TGAGTTAATT GAAATGATGG ATCATATCAT TGCACAACTA GATAATAGTG 1860 

AGGAAAATGT AAGATATTGG CGAAAAGAAG TGACAGTAAC AGAGGAATTT CAAAATTTAT 1920 

TCAACCATAT ATTGAAAATT GATGAAATGG TGCATGCAAA TGAAGCGCGT ATTGCGTAlG 1980 

AAGCAGACAT GCGAAAACCT TTATATAGTA AACGCATTTA TCaAAATTTA ACaTTAGACT 2040 

CtATkGTTTT TAGAAATACA TTGAGATATA CAGCGATTAT GATGATAGCG ATATTTATTG 2100 

CGTTAATGTT TGATTTTGAA AAAGCATACT GGATACCGTT ATCTGCACAT ACAATATTAC 2160 

TAGGAACATC AACTATACAT GCAATCGAGA GAGGTATGGC ACGAGGTTTA GGTACTATTT 2220 

TAGGTGTGTT AGTACTTTCA GTCATATTGT TGTTTTCAAT ACCAACACCT GTTGCAGTAA 2280 

20 TTTTAATGGG CATTGCAGCA TTGTTTACTG AAGCATTGGT GGGAGCAAAT TATGCGATTG 2340 

CAGTAGTTTT TATTACAATA CAAGTTATTT TAATGAACGG ATTAGCATCA CAGAATTTAA 2400 

CAATTAACAT TGCGTTTCCA AGAGTTATTG ACGTTGCAAT GGGTATTGTG ATTGCAATCA 2460 

TAGGTTTATT TGTCCTTGGA CAACGTACCG CATCCGCATT GCTTCCTAAT GTAATGGCTG 2520 

AAGTTGTTCG TAAAGAAGCA ACGCTCTTTC ATTATTTATT TTCTGAAAAT CAATAT 2576 
(2) INFORMATION FOR SEQ ID NO: 309: 



10 



15 



25 



30 



35 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 668 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double - 

(D) TOPOLOGY: linear 



' (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 309: 

40 CAAGCACATT ACGATGGTCT AATACTTTGC TAATAATTTC TTCTTGTCCT GGTCGAAACG 60 

TTTCATACCC AAAGTAATGC GATAATGTTT GTTGCATCAT AAATTGACCC CTTATTGTTG 120 

TTCTTTAATT TCTTCTAACT CACTCCATCT TGTGATGTCT AAATCATATT GAATTTCAAG 180 

45 TTGTTCTTTT TCTTCGTTTA ATTCTTTAAT TTTCCCATAA TCTGCACTTG CCTCAATCAT 240 

GAGCACATCA ATTTCTTCCA TTCTTACTTC CGCTTGTTCT ATGCGTTTCA TCAATTGTTC 300 

ATATTCTAAT TTTTCTTTAT ATGATAAACC ATTTTTCTTA CGTACAGTTG TAGAAGATTT 360 

50 

AGATTGTTGC TTCAATGTGG ATTTATTTTT ATCTAATGAT TTTTTATAAC TTTCATAATC 420 

TTCAAAAGTT CCGATAATCT TTTCCATCTG ACCATCATGA ATAAACCAAT ATGACTGTGC 480 
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5 



10 



20 



25 



30 



35 



40 



45 



50 



AATATAATCT 


TCAAGTATTG TTAAAGTCTC AGTATCTAAA TCATTTGTCG 


GTTCATCTAA 


600 


CAACAGAACA 


TTTGGCTGGT GTACGAGTAG 


ACGTAATAAA TACAAACGCT 


TTTGCTCTCC 


660 


ACCAGATA 








668 


(2) INFORMATION FOR SEQ ID NO: 310: 






(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 12173 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 






(xi) , 


SEQUENCE DESCRIPTION: i 


SEQ ID NO: 310: 






CATCAGTTTA 


TTTTGAAAGG CAATGCGATC 


ATTTCATGTA TTTATGTTGT 


TTGAAACATC 


60 


GTTAGATAAC 


AATAGTGATA TTGCACATTT 


TAAGCTGAAG ATGGAAAAAT 


ATTCGATAAT 


120 


CAAATAAACA 


ATGAATTTTA GAAGGTACAA 


TGACGTTCAC TAATTTAAAT 


ATAGCTGAAT 


180 


GTGTTGGTGA 


GTGATGTTCA CTATAGATTT 


ATATTAATAT ACAAAGACAA 


AGGTTGTTAA 


240 


TTTTTATTAA 


GCGTTAGGTT GAATGTATGA 


GAATTTTAGA TTTATAATAG 


AAGATAGAAA 


300 


CGAAAATTTT 


TCTTAAAAGC AGTAATGTTG ACTCAAAATA AGCTATAATA ATGACACTTA 


360 


TTTAATTGAT 


TAACATTTGC TAATAAATAT 


CAATATAGAA TATAACTTTC 


CAATAATGAC 


420 


TGAGAAAATC 


GAAATGTCAG TCTCGAATCA 


TATAATTAGA AAATTGATTA 


TTTTCTGTCA 


480 


ATTTAGGGTT 


GAACTATACA TATGATATTG 


TTAGAATATT TTTTAACATT 


ATATTTTATT 


540 


GCTTTAAAGT 


GGAATATACT TGAAATAATT 


AGTAGAGGTG AGTAAGGATG 


AGTAATAAAT 


600 


TAGAATCATA 


CAGAAGTGAG ATTGTATCAC 


TGAATCATCA AATTTTAGAC 


TTATTATCTA 


660 


AACQTGGTGA ACTAGCACAA AAAATTGGGG 


AAGAAAAATT AAAACAAGGT 


ACACGTATTT . 


720 


ATGATCCACA 


ACGTGAAAAA GAAATGCTTA 


ACGACTTAAT CGATAGTAAC' 


AAAGGACCAT 


780 


TCAACGATAA 


TACTATTAAG CAATTATTTA 


AAGAAATTTT CAAAGCCTCT 


ACAGATTTAC 


840 


AAAAATCTGA 


AAATGAAAAA CATTTATATG 


TATCACGTAA GTTGAAACCT 


GAAGATACGA 


900 


TTGTAACATT 


TGATAATGGG GGCATTATAG 


GAGACGGCAA TAAATCATTT 


GTATTTGGGC 


960 


CATGTTCAGT 


TGAATCATTT GAACAAGTTG 


AAGCTGTTGC TAAAAACTTA 


CATGCTAAAG 


1020 


GTGAAAAATT 


TATTCGTGGC GGTGCATTTA 


AACCACGTAC ATCACCATAT 


GATTTCCAAG 


1080 


GCCTAGGTGT 


TGAAGGACTT AAAATACTTA AACAGATTAA AGATAAATAT 


GATTTAAATG 


1140 


TTGTCAGCGA 


AATCGTAAAT CCAAATGATT 


TTGAAGTGGC TGATGAGTAT 


TTAGACGTAT 


1200 
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AAAAGCCTAT TCTATTAAAA CGTGGTTTAT 
CTGAATACAT TGCTTCACAA GGTAATCAAA 
5 CTTATGAAAA GGCGACACGT AACACTTTAG 

GTACACACTT ACCAGTCATG GTAGATGTTA 
TACCAACTGC GAArsAgCAT TAGCAGTTGG 

10 

AGATCCATCT GTTGCACTTA GTGATGCGGG 
ATTTTATGAT GAATTAAAGC CTTTAGCTGA 

15 TTCCAAGGAA ACTATAGACT ACTTAACTAA 

GAATCGACAA TTTTAAACTT ACAGCCATTC 
ATTTTTTGTA TAGAAATAAA GGTATACTGC 

20 TGTTCAATTT CACAATTATT AAAGATTATG 

GAATTATCTG TAAAATATAA TAGATTCACA 
ACAAATGCAA TTGATATTTG AAAAGGCTTT 

25 GTTTATATAA AATTAAAATA TATCGTTCGT 
TTTTCGCTAA ATTTTTCCAA ACAAAAATAT 
GAAAATGAAA TGAAAACATG TTATTATAAT 

30 

ACAGTTACTA TATATGATGT AGCAAGAGAA 
GTTGTTAATG GGAACCAAAA TGTTAAAGCA 
AAGCGTTTGA ATTATCGTCC AAATGCTGTT 

35 

ACAGTAGGTG TGATCATTCC AGATATATCT 
CTTGAAGATA TTGCAACAAT GTATAAATAT 

40 CCTGAAAAGG AAAAAGAAAT TTTTAATAAC 
TTCCTTGGTG GTACAATTAC TGAAGAAATG 
GTAGTAGTAT CAGGAACAAA TGGTAAGGAT 

45 ACTGAAGCTG CGAAAGAAAT TACGGGAGAA 
TTAGTAGGTG GAGAACATTC TAAAAAAGCT 
GTGTTAAATA AAAATGGCCT TCAATTAGGT 

50 

TATAAAGAAG GCGTAAAAGC TTTTGCCAAA 
TGTATCAGCG ACGAAGAAGC AATTGGTATT 

55 



CTGCTACAAT CGAAGAGTTT GTTTATGCAG 1320 

ACATTATTTT ATGTGAACGT GGAATCCGAA 1380 

ATATTTCAGC AGTACCAATT TTAAAACAAG 1440 

CGCATAGTAC AGGTCGTAAA GATATCATGT 1500 

TGCTGATGGA GTTATGGCTG AGGTGCATCC 1560 

TCAACAAATG GATTTAGATG AATTCCAAGC 1620 

TTTATATAAC GCTAAAAAGT TAAAATAATA 1680 

TATGTCATGT TGAAGTAGAA TATTATCTTT 174 0 

TAAGAGTATA TTACTTTTAG AGTGGCTATT 1800 

ACTTAACGAT TGTTATAATA CTTCGACACT 1860 

ACTGATAGCA GTAATTAAAA TTATAACTAT 1920 

CATTTGTTGC TGAAATGTGA ACATTTTTCA 1980 

CTCAAAACAT TACAATTAAA AATGAAAAAA 2040 

TATCATTTAG CGTTTGTTTT TATTTCAAGC 2100 

GTTACTGTAA ATTAAAATAT GGTAAACTAT 2160 

GAATAAAACG TTTACAAGGA GGAAATTATG 2220 

GCGCGTGTCT CTATGGCCAC AGTGTCGCGT 2280 

GAAACTAAAA ATAAAGTTAA CGAAGTCATT 234 0 

GCTAGAGGTT TAGCTAGTAA AAAGACAACA 2400 

AATATCTATT ATTCACAACT TGCTCGTGGA 2460 

CACTCAATTA TTTCAAATTC AGATAACGAT 2520 

TTATTAAGTA AACAGGTTGA TGGTATTATT 2580 

AAAGAATTGA TAAATCAATC ATCTGTACCT 2640 

GCACATATAG CATCAGTTAA TATTGATTTT 2700 

TTAATTGAAA AAGGCGCTAA ATCATTTGCT 2760 

CAAGAAGATG TTTTAGAAGG TTTAACTGAA 2820 

GATACATTGA ATTGTTCTGG TGCTGAAAGT 2B80 

ATGAAAGGCA ATTTGCCAGA TGCCATTTTA 2940 

ATGCATAGTG CAATGGATGC TGGTATTAAA 3000 
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CCACAACTTT CTAGTGTTAT TCAACCATTA TATGATATCG GTGCAGTAGG GATGCGCTTA 3120 

TTAACAAAAT ATATGAACGA TGAAAAGATA GAAGAACCAA ATGTAGTTTT ACCTCACAGA 31 BO 

5 

ATTGAATACC GAGGAACTAC AAAATAAATT CACAAAATTA GGCATTCATC TAACGACCCA 324 0 

AATTATATGG GTGTTGGAAG AATGCCTTTT ATTTATCTTT TAAAATCGTT GCAGATTAGG 3300 

TTACTTATTG ACGAGTAGAT TCGTACCAAC TCGCTATATG TAAAGCTAAT TTTTTATTTT 3360 

10 

TTTCACTAAT TTCTTTTGTG CGGGGGACAT AGGTATAATC ATTTAAACGA TCTTCCCATC 3420 

TTTTAGGTAA TAATTCAGAT GAATAATGTT TCCATTTATT AATCCATTCT AACGGTAAAT 3480 

15 AACCACTTTG AATTGGTTGA TCAATTAAAC TTAAGAATAC ATGACTCCAT GCACGTGGTA 3540 

CGACTCTCCA AATATTGTAG CCTCCGCCAC CAAACATAAT TACCTTTCCA TTCGTATAAG 3600 

AATCAGCTAA ATATTTTACA AAATATGGAA TTTCATATAA TGAATGTAAC GTACAATTTA 3 6 60 

20 GATGAGTTAG TGGATCACGA TAATGTATAT CGACACCATT TACGCTTAGA ATAATATCAG 3720 

GTTTAAAACT CTTTACGACA GGCTCAACTG TTAATTTAAA ACACTCCAAA AATGATGCAT 3 7 80 

CTTCTGTATA CGGTTCAAGT GGGACATTTA CAGTGTGTCC ATAGCCGATA TCTTCACCGC 3 840 

25 

GCTCAGTATA GTGACCAGAG CCTGGGAAAA GAAATTTTCC GGTTTCATGG ATAGAATAAG 3 900 

TAGTAACATG GTTATCGGCA TAGAAACTCC ATTGTGTACC ATCTCCATGA TGTGCATCGG 3960 

TATCTATGAT TAAAACGCGT TGATTGTATT CTTTAGCTAA GTATTGTGCG GTAATTGCAA 4 020 

30 

TATCATTGTA TATACAAAAA CCACTTGCTC GACCAGGTTG AGCGTGATGC AAACCACCAC ' 4080 

CTAAGTGACA ACCATTTAAT ACTTTGCCTG ACATAATAAG ATCTGCTAAA GTTAAAGCGC 4140 

35 CTCCAACAAT TGTGGCACTA TGGCGGTGCA TATGCTTAAA TTGACCATTC TCTTCATCAT 4200 

TTAATCCATA TTTCTTAGCC TCATCTTCAC TGATAATGCC ATGTGAAGCA TGCTTAATAG 4260 

CTTCGACGTA ATCATATTTA TGAATTAACA TTAATTCGTC ATCTGTTGCA ATTCTAGGTT 4320 

40 GTACTATTTG TTCTGGAGAC AATAAATTTG CATTCAAAAG TAGCTCTGTT GTTAATTTTA 4380 

AACGCATTTG ATTGAAGGGA TGTTGGTCAT GAAATCGATA TTGTAATAAC TTATCTGAAT 4440 

AAACATATGC AGTTTTTGAT GAATGTTGTT GCATATAATC CCTCCGATAT TCCAAAAATT 4500 

45 AAAAGAAAAA CCGATTCATA TAACGAATAT CATCAAACGC TTGTTGCTGT TCTAATGTAA 4560 

TGTTTTTGCC AATTCTTGCC ATTAAACAAT TAGCTGGATG ACTTGTTATT TCTGGATCAT 4620 

CTGTAGCGAA TATTTCAAGT CCACCAGTTG CCATTAACCG CTGCATTAAT TTTTTATAGT 4680 

SO 

CAAATACATC TAACTTTGAA TTTTTTAAAT CCCAATGCCA GTAATATTCT GTAGTTATAA 4740 

CGATATAATT CTCGAATTCT GGTGTAGAAA GGCTAAGTTG TATCAGCTTT TCTGCAAGTT 4 800 
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TACCTGTAGA CCAGCGCTCA ATTTCATCAG GATAGTGGAA AGTGACATAA CCCACAATGA 4 920 

GTTGATCTTG GCGAGCAACA TAAATTCTAC CTTCTGGTAA TGTTGTAATT TCTAACAAAG 4 960 

5 

CTTTATACTG ATCTTCAGCA TCTCTAAATG CGGTTAAATG CGCATCGAAA GTAAGCGCTT 5040 

TCAAATCTtC GTGTGTTAAA GGACCTTCAA TAACAAATTG CTTGTCATGA ATGTAATAAT 5100 

CTTCGGATTG ATACGTCTTT AAATGATTCA TATTTTCAAC TCCTCAATCG ACGTCGTGAT 5160 

10 

TGTATTAAAT TCATTATATA GAAaATTTAC AATAATTAAT ACTAGAAAAA GGATAAAAGT 5220 

AAAAATTTTG AATAATTAGA AATGTTATGT ATAATATTGA GAAAGAAAGC GTTTTCACAT 5280 

1S AACAAAGGGG GAGTTTCAAA TGAAAGTCGA AGTTTATAAA GGAGCGCAAG GTAAACATAA 5340 

CCTTAAAGAT TATGAAGAAA CATATAATAC TTTTGATTGG AAAGACGTAG AACAAGCATT 5400 

TTCTTGGAGT GAAACTGGAA AAATGAACAT GGCATATGAA TGCATAGATC GCCATGTAGA 5460 

20 TCAAGGATTA GGGGATAAAA TAGCGTTAAA TTACAAAGAT GAGCACAGAA AAGAATCGTA 5520 

TACTTATAAA GATATGCAAC GGTTATCTAA TAAAGCAGCG AATGTTTTGT CTGAACATGC 5580 

AGAAGTTGAC AAAGGTGACA GAGTATTTAT ATTTATGTCG CGTACACCTG AACTATATTT 5640 

25 

TGCGTTGTTA GGTGTTTTAA AAATTGGTGC AATTGTTGGG CCGTTATTTG AAGCATTTAT 5700 

GGAAAAGGCA GTTGCGGATA GATTAGAGAA CAGTGAAGCT AAAGTGTTAA TTACTAATAA 5760 

GGCATTGTTA CCTCGAGTAC CTGTAGATAA ATTACCAAAC TTGAAAAAAA TTGTTGTCGT 5820 

30 

AGATGAGGAT GTAGAAGACA ATTACATAGA CTTCATTAGT TTGATGGAAA CTGCTAGCGA 5880 

TGAATTTGAC ATTGAATGGT TAAAGTCGGA TGATGGTTTG ATTTTACATT ATACATCAGG 5940 

3s TTCTACTGGG CAACCTAAAG GtGTATTGCA TGTTCAACAA GCAATGTTAG TGCACTATAT 6000 

TTCTGGAAAA TATGTATTAG ATTTACAAGA AGATGATGTT TATTGGTGTA CAGCAGATCC 6060 

AGGTTGGGTT aCAGGAACAT CTTATGGTAT TTTTGCACCA TGGTTAAATG GCGCTACAAA 6120 

40 TTGTATAGCT GGTGGTCGCT TTTCGCCAGA ACAGTGGTAT AGTATGATTG AAGATTTTAA 6180 

AGTGACGATT TGGTATACGG CACCAACAGC TTTAAGAATG TTAATGAGTG CTGGTGACGA 6240 

TATTGTTGAG AAATATGACT TGTCATCGTT ACGTTCGATT CTATCAGTAG GTGAGCCTTT 6300 

45 AAATCCTGAA GTTATAAAAT GGGCGAAAAA AGTATACGGT TTAACGGTGT TAGATACTTG 6360 

GTGGATGACA GAAACAGGTG GACATATGAT TGTTAACTAT CCAACGATGG ACGTcAAGCT 6420 

TGGCTCAATG GGCAAACCAT TACCTGGTAT TCAAGCTGCA ATTATCGATG ATGCAGGGAA 6480 

50 

TGAATTACCA CCAAATCGAA TGGGCAACCT TGCTATAAAA AAAGGCTGGC CATCAATGAT 6540 

GTATCGTATC TGGAAGAATC CAGAAAAATA TAAATCATAT TTTATTGGAG ACTGGTATGT 6600 
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TGATGTAATT ATGACAGCTG GTGAACGAGT TGGACCATTT GAGGTTGAGT CTAAATTGGT 6720 

TGAACACGAA GCAGTTGCCG AAGCAGGAAT TATTGGTAAA CCTGATCCGG TTCGCGGTGA 6780 

5 

AATAATTAAG GCGTTTGTTG CACTGAGAAA AGGATATGAA CCAACAGACG AATTAAAAGA 6340 

AGAAATTCGT ATATTTGTTA AAGAAGGTTT GTCGGCACAT GCAGCACCAC GTGAAATCGA 6900 

io ATTTAAAGAT AAATTACCTA AAACACGGTC AGGTAAAATT ATGAGACGTG TATTAAAAGC 6960 

TTGGGAATTA AATTTAGATG CTGGGGATTT AAGTACAATG GAATAATGAC ATGAATGTTA 7020 

TTGAAGATTT TTTTCGAAGA ATAAAGGGTG ACAACATATT TCATGTCAAT GTTTAAATAA 7080 

75 TCGTTTACTT TACGATAAGC AATATAAAGA ACTGTTAACT TGTGTCATAT CATTTCGTAG 7140 

AAAGCATTTG AAAATGATGA CATAACAATA ATGGCATATC TTTATATTGC TTTTTATTTT 7200 

TAATATGATC TTTGGAAGAT GATTATTTTA AATAATAGAA AAATATAGTT ATCAATAGTA 7260 

20 TCAAGCGCTA AAAGTTGTAT AATACAAAAC TTTAATAAGT GAATTTATTG CAAAAATGAA 7320 

AGCGCTAACC CGATTTAGTC GACAAGTTTT TAACAGTTCG TTATTATATG AATGTAAGTA 73 80 

AAAATTTCTT AGCTACAACT TACATATTAT AAATGCATAA ATTAAACAAA AAGGGGCGAA 7440 

25 

AAAAGTTGAC TCATTTATCA GATTTAGATA TTGCGAATCA ATCAACACTA CAA CCAATTA 7500 

AGGATATTGC TGCATCAGTA GGTATTTCAG AGGATGCATT AGAACCTTAT GGTCATTACA 7560 

AAGCTAAAAT CGACATTAAT AAAATTACGC CAAGAGAAAA CAAAGGGAAA GTTGTTTTAG 7620 

30 

TAACTGCGAT GAGCCCAACA CCAGCTGGTG AAGGTAAATC AACGGTTACA GTTGGTTTAG 76 80 

CTGATGCATT CCATGAGTTA AATAAAAACG TTATGGTTGC ATTAAGAGAG CCTGCTTTAG 774 0 

3£ GACCAACATT TGGTATCAAA GGTGGTGCGA CTGGTGGTGG TTATGCGCAA GTCTTACCTA 7800 

TGGAAGATAT CAACTTACAT TTCAACGGAG ATTTCCATGC GATTACAACT GCAAATAATG 7860 

CATT&TCTGC GTTTATCGAT AATCATATTC ACCAAGGTAA CGAATTAGGA ATCGATCAAA 7920 

40 GACGTATTGA GTGGAAACGT GTATTAGATA TGAATGATCG TGCACTTAGA CATGTAAACG 79B0 

TTGGGTTAGG TGGACCTACA AATGGTGTAC CACGTGAAGA TGGCTTTAAT ATTACAGTAG 8040 

CGTCTGAAAT TATGGCGATT TTATGTTTAA GTAGAAGTAT TAAAGACTTA AAAGATAAAA 8100 

45 

TTAGTCGTAT TACTATTGGT TACACTAGAG ATCGCAAGCC AGTTACAGTT GCAGATTTAA 8160 

AAGTGGAAGG TGCACTTGCA ATGATTTTAA AAGATGCAAT AAAACCAAAC TTAGTACAAT 8220 

CAATTGAAGG GACACCTGCA TTAGTTCATG GTGGACCATT TGCGAATATC GCACACGGTT 8280 

50 

GTAACTCAAT TTTAGCAACT GAAACAGCAC GTGATTTAGC TGATATCGTT GTAACGGAAG 8340 

CTGGATTTGG TTCAGACTTA GGCGCTGAAA AATTCATGGA CATTAAAGCG CGTGAAGCAG 8400 
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GTGTAGCGAA AGATAATTTA AAAGAAGAAA ATGTAGAAGC AGTAAAAGCA GGAATTGTTA 8520 

ATTTAGAGCG TCATGTTAAT AATATTAAAA AATTCGGTGT AGAACCGGTT GTTGCAATTA 8580 

5 

ATGCATTTAT ACATGATACC GATGCAGAAG TAGAATATGT AAAATCTTGG GCTAAAGAAA 864 0 

ATAACGTACG AATTGCCTTA ACTGAAGTTT GGGAAAAAGG TGGTAAAGGT GGCGTTGACT 8700 

TAGCAAATGA AGTATTAGAA GTCATTGATC AACCTAATTC ATTTAAACCT TTATATGAAT 8760 

10 

TAGAATTACC ATTAGAGCAA AAGATTGAAA AGATTGTGAC TGAAATCTAT GGCGGTTCAA 8820 

AAGTAACGTT TAGCAGTAAA GCGCAAAAAC AATTAAAACA ATTTAAAGAA AATGGTTGGG 8880 

15 ATAATTACCC AGTATGTATG GCGAAAACAC AATATTCATT CTCAGATGAT CAAACGTTGT 8940 

TAGGTGCACC ATCAGGATTT GAAATTACAA TTCGTGAATT AGAAGCGAAA ACAGGTGCAG 9000 

GATTTATCGT AGCGTTGACA GGTGCAATCA TGACTATGCC TGGTTTACCT AAAAAACCAG 9060 

20 CAGCATTAAA CATGGATGTT ACTGATGATG GTCATGCAAT TGGGTTATTC TAATAAATCA 9120 

TGTCAATTGT TTAATAAAGA TAAGTAAATA GTTTAATAGA CCGGACTGTT GGAGATGCAT 9180 

TATTTCAGCA GTTCGGTTTT TTGCTGTGCT AAAAATAGAT TCAATTTGGC GAATCTAACG 9240 

25 ACAATGTTTG AAGGTGGTTA ATTAATGTAT ATGAAGATAA AAAGTGGGCT TGAAGAATAG 9300 

GAAAGCGATG CAATGAATAT TCCATATTAA AAAAAATTAA TAAAATAGGT TGCAATATTT 9360 

s AATTGGGATG CGCTACAATT AACACTAATA ATTGATATTG ATAATTATTA TCAATTAAAT 9420 

30 

ATAATCTTAT AGGAGTTGTT AACAACATGA ACAAACATCA CCCAAAATTA AGGTCTTTCT 94 80 

ATTCTATTAG AAAATCAACT CTAGGCGTTG CATCGGTCAT TGTCAGTACA CTATTTTTAA 954 0 

TTACTTCTCA ACATCAAGCA CAAGCAGCAG AAAATACAAA TACTTCAGAT AAAATCTCGG 9600 

35 

AAAATCAAAA TAATAATGCA ACTACAACTC AGCCACCTAA GGATACAAAT CAAACACAAC 9660 

CTGctACGCA ACCAGCAAAC ACTGCGAAAA ACTATCCTGC AGCGGATGAA TCACTTAAAG 9720 

40 ATGCAATTAA AGATCCTGCA TTAGAAAATA AAGAACATGA TATAGGTCCA AGAGAACAAG 9780 

TCAATTTCCA GTTATTAGAT AAAAACAATG AAACGCAGTA CTATCACTTT TTCAGCATCA 9840 

AAGATCCAGC AGATGTGTAT TACACTAAAA AGAAAGCAGA AGTTGAATTA GACATCAATA 9900 

45 . CTGCTTCAAC ATGGAAGAAG TTTGAAGTCT ATGAAAACAA TCAAAAATTG CCAGTGAGAC 9960 

TTGTATCATA TAGTCCTGTA CCAGAAGACC ATGCCTATAT TCGATTCCCA GTTTCAGATG 10020 

GCACACAAGA ATTGAAAATT GTTTCTTCGA CTCAAATTGA TGATGGAGAA GAAACAAATT 10080 

SO 

ATGATTATAC TAAATTAGTA TTTGCTAAAC CTATTTATAA CGATCCTTCA CTTGTAAAAT 1014 0 

CAGATACAAA TGATGCAGTA GTAACGAATG ATCAATCAAG TTCAGTCGCA AGTAATCAAA 10200 
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AGGCAACGAC CAATATGAGT CAACCTGCAC 
CGTCAAGCCA ACCAGCTCAT GAAACAAATT 

5 

AGTCAAGTAA TCAGTCGGAT GTTAATCAAC 
ATGCAATTAA AAACCCGGCT ATCATCGATA 
TTGATTTTCA AATGAAAAAT GATAAAGGTG 

10 

TTGAACCAGC AACTGTCATT TTTACAAAAA 
CAGCTTCAAC ATGGAAGAAA TTTGAAGTTT 

1S TAGTATCATA TGATTCTGAT AAAGATTATG 

CGAGAGAAGT TAAAATTGTG TCATCTATTG 
ATTATACGCT AATGGTCTTT GCACAGCCTA 

20 AAGAAACATA CAATTTACAA AAATTATTAG 

GACAAGTTTA TGAATTAGAA AAATTACAAG 
ATAAAAAGAA ATTAGATCAA ACTAGAGTAG 

25 CGGAATTTGA AAATGTtACA CCTACAAATG 

TTGTTGTTTT TGAAAGTGAA GAAAATAGTG 
CATTCTATAC AGCAACTTTA AATGGTCAAA 

30 

GTTACTGGAA AGATTTAATT GTAGAAGGTA 
AAAATAATTC TAGAACGCTG ATTTTCCCAT 
TTGTTAAAGT CGTTGTGGCA AACATTGGTT 

35 

ATCAGGATAT CAATACAAAA GATGATGATA 
ATGTACAAAC AGGACAAGAA GGTAAGGTTG 

40 CTGCAACAAA TCCTAAAGAT GCGTCTGATA 

TGGTTAAAGA TGCTGATAAT AATATTGATA 
CCGATATGTC GGATAATAAT CACTTCGATA 

45 TTGCCAAAGA TACTGATAGA AATGTGGATA 

CTAATGTCGA TACTGATAAA GACTCTAATA 
ATATTGCCGA TAAAAATAAT CATACTGGAA 

50 

ATTATAATAA TACAGACAAA GTTACTGACA 
TTCATAAAAC TGTAGATAAA ACAGTGAAAA 

55 



AACCAAAATC 


GTCAACGAAT 


GCAGATCAAG 


10320 


CTAATGGTAA TACTAACGAT AAAACGAATG 


10380 


AGTATCCACC 


AGCAGATGAA 


TCACTACAAG 


10440 


AaGAACATAC 


AGCTGATAAT 


TGGCGACCAA 


10500 


AAAGACAGTT 


CTATCATTAT 


GCTAGTACTG 


10560 


CAGGACCAAT 


AATTGAATTA 


GGTTTAAAGA 


10620 


ATGAAGGTGA 


CAAAAAGTTA 


CCAGTCGAAT 


10680 


CCTATATTCG 


TTTCCCAGTA 


TCTAATGGTA 


10740 


AATATGGTGA 


GAACATCCAT 


GAAGACTATG 


10800 


TTACTAATAA 


CCCAGACGAC 


TATGTGGATG 


10860 


CTCCGTATCA 


CAAAGCTAAA ACGTTAGAAA 


10920 


AGAAATTGCC 


AGAAAAATAT 


AAGGCGGAAT 


10980 


AGTTAGCTGA 


TCAAGTTAAA 


TCAGCAGTGA 


11040 


ATCAATTAAC 


AGATTTACAA 


GAAGCGCATT 


11100 


AGTCAGTTAT 


GGACGGCTTT 


GTTGAACATC 


11160 


AATATGTAGT 


GATGAAAACA AAGGATGACA 


11220 


AACGTGTCAC 


TACTGTTTCT 


AAAGATCCTA 


11280 


ATATACCTGA 


CAAAGCAGTT 


TACAATGCGA 


11340 


ATGAAGGTGA 


ATATCATGTC 


AGAATTATAA 


11400 


CATCACAAAA 


TAACACGAGT 


GAACCGCTAA 


11460 


CTGATACAGA 


TGTAGCTGAA AATAGCAGCA 


11520 


AAGCAGATGT 


GATAGAACCA 


GAGTCTGACG 


11580 


AAGATGTGCA 


ACATGATGTT 


GATCATTTAT 


11640 


AATATGATTT 


AAAAGAAATG 


GATACTCAAA 


11700 


AAGATGCCGA TAATAGCGTT GGTATGTCAT 


11760 


AAAATAAAGA 


CAAAGTCATA 


CAGCTGAATC 


11820 


AAGCAGCAAA 


GCTTGACGTA 


GTGAAACAAA 


11880 


AAAAAACAAC 


TGAACATCTG 


CCGAGTGATA 


11940 


CAAAAGAAAA AGCCGGCACA 


CCATCGAAAG 


12000 
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CATGGTGGGG CTTATATGCG TTATTAGGTA TGTTAGCTTT ATTCATTCCT AAATTCAGAA 12120 
AAGAATCTAA ATAATTAnCT AAATATAGCA TATGTATGAT TAACTTTGTA GAC 12173 

5 

(2) INFORMATION FOR SEQ ID NO: 311: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH : 1316 base pairs 

(B) TYPE: nucleic acid 

™ (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

1S (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 311: 

CAACATTAAT ATTGATATTA AATCTTCCTG GATAACGTGC TTGTTCGAGT GATAAGTATG 60 

CACGCACTTG ACTTAACTCT TTATCTAAAG TAATCGTATG TTGCTTAGAG CCTTGTAAAT 120 

20 TCGCTCTGAA AAAATAACTC AATTCTAATA GTAACTCTCG TGCCTTTTCG CTATTTATTC 180 

TAACTAAAGC TGAGATCGTG TTAATTGAAT TGAAGAAAAA ATGTGGACTC ACTTGTGCCT 24 0 

GTAATGACTT AATCTCAGCA TCTTTCAATA ACTTACTTTG CGTTTCGGCT TCACCAAGTT 300 

25 CAATTTGGCT ACTAAAAATA TTTGCCAATC CTTCTGCAAG TTGACGTTCC ACAAAAGTTA 360 

AATCATTAGG GTTTGTAAAA TACATCTTCA ATGTACCGAC GATAGAACCA TGCATCTCAA 420 

GTGGTATCAC GATAGCTGCT CTAAGCGGGC AATTCGGATG ACTACAACCA ATCTCTTCTT 480 

30 

. TAGTATGAAC TTCTTTCAAC TTTCCTGATT TCAATACATC TTTAGACAGA CTTGTTAATA 540 

TTTCATTTGT TGGTATGTGA TGATCACTAC CTGCACCTAC ATGCGATAAG ATTTCATTTT 600 

TGCTTGTAAT TGCTACGGCA GATACTTTCA TTAAATTTTT AATAATCATC GCAATTTGCT 660 

35 

GTGCCGATTC TCTATTCAAT CCTTCTTTAA AATACGGCAA TGTCTGGTTC ATCAATTGCA 720 

GTACATCATG TGTTTGAACA GCCTTCATTT GCTCCTCTTG CTTTAATGTT GAAATGATAA .780 

40 TAGACATAAA AATCGCCGTA CCAACGCTAT TAACAATAAT CATTGGTAGT GCAATTAATG 84 0 

ATATGAGGTC AACCGCATAT GCTTTGTCGT GGGAAAATGT TAAAATGCTC AACATTTGAA 900 

TCATTTCCAT AACAATTCCA ATCATGGCAC TTTTCGCAAT ACTCGGGTAA CGCTTGCGTC 960 

45 TTTGAGCTTG TAAGCCAAAA TAACCAGCAA TTATACCAAT AAATATAGAT GAGATAAGAT 1020 

AAACTTGTGC ATCCGCCCCA CCCATATACA CTCTGAAAAT ACCTGAAATA ACGCCAACAA 1080 

ATAGACCTAC AAAAGGGCCA CCAACTAATC CTGCGACACC TATCGTTAAT ACACGTGTGT 114 0 

50 

TAGCTAAAGA TACATCATCA TCTAAACGGA AGTACACACT TCCTGACAAA CTATGTTGAT 1200 

GATCGATGAC GATACCAGTT AAATTAGACA TTAAGGCAAA CAAACTGAAA ATAATACATA 1260 

55 



1159 



EP0 786 519 A2 



(2) INFORMATION FOR SEQ ID NO: 312: 

(i) SEQUENCE CHARACTERISTICS: 
5 (A) LENGTH: 7972 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



10 





(xi) 


SEQUENCE DESCRIPTION: ; 


SEQ ID NO: 


312: 








TATAAATATT 


ATTTTATTAT 


CGTTTATCGC 


TATTTGTGTT 


ACATAATCAA 


AACCATAAAT 


60 


15 


TCTTACTCAT 


TCAGATTTAC 


CCAATATTTT 


TACTTTTATA 


ATGTAATGCG 


TTTTATCCAA 


120 




GTTATTTTTT 


AAAAATAAAT 


ATTGAATTnG 


GGGCTGnTTT 


CATGTCATTA 


AGAGATGAAG 


180 




CATTGGAAAT GCACAAACGT AATCAAGGTA AATTAGAAGT TAAACCAAAT GTAAAAGTTA 


240 


20 


CTAATAAAGA 


GGAATTAAGT 


TTAGCATACT 


CACCTGGCGT 


TGCTGAACCG 


TGTAAAGATA 


300 




TTTATGAAGA 


TAAAAGAAAA 


GTATATGATT 


ACACAATTAA 


AGGAAATACA 


GTTGCAGTTA 


360 


25 


TTACTGATGG 


AACAGCGGTA 


TTAGGTTTAG 


GTAACATTGG 


ACCTGAAGCA 


AGTATTCCTG 


420 


TAATGGAAGG 


TAAAGCAGTA 


TTATTCAAAA 


GCTTCGCTGG 


TATCAATGGG 


GTGCCTATTG 


480 




CGTTAAATAC 


AACTGATACC 


GAAGAAaTCA 


TTAAAACAGT 


TAAGTTGTTA 


GAACCTAATT 


540 


30 . 


ATGGTGGTAT 


TAATTTAGAG 


GATATTTCGG 


CACCACGTtG 


TTTTGAAATT 


GAAGAACGAT 


600 




TGAAAAAAGA 


AACTAATATT 


CCGGTATTCC 


ATGACGATCA 


ACATGGTACA 


GCAATTGTAA 


660 




CATTGGCAGG 


TTTGGTAAAT 


GCATTGAGAG 


TTGTTAACAA 


AGATATTGCT 


AAAATAAAAG 


720 


35 


TTGTACTAAA 


TGGTGCTGGT 


GCAGCAGGAA 


TAGCCATTGT 


TAAATTACTA 


TACGCGTATG 


780 




GTGTAAGAAA 


TATGGTTATG 


TGTGACTCAA 


GAGGCGCAAT 


TTTTGAAGGA 


CGTTCATATG 


840 




GTATGAATCC 


TACGAAAGAT 


GTTGTAGCAA 


AATGGACAAA 


TAAAGATAAG 


ATTGAAGGGT 


900 


40 


CTTTAGAAGA 


AGTCGTAAAA 


GACGCAGATG 


TATTTATCGG 


GGTTTCTGTA 


GCTAATGCGC 


960 




TGTCACAAGA 


TATGGTTAAG 


AGTATGGCAG 


ATAATCCAAT 


TATATTTGCA 


ATGGCTAATC 


1020 


45 


CAAATCCTGA 


AATAATACCT 


GATGATGCCA AAGCGGCAGG 


TGCACGAGTT 


GTTGGTACAG 


1080 


GACGTTCAGA 


CTATCCTAAC 


CAAATTAATA 


ATGTATTAGC 


TTTCCCTGGT ATTTTTAGAG 


1140 




GTGCATTAGA 


GGTTGAAGCT 


ACACATATAA 


ATGAAGAAAT 


GAAAAAGGCA 


GCTGTAGAAG 


1200 


SO 


CGATTGCTGA 


TTTAATCGAT 


AGTTCTGAAT 


TAAATGAAGA 


CTACTGTATC 


CCAGGACCGT 


1260 




TTGATAAACG 


TGTAGCGCCA 


TCAGTTGCTC 


GTAATGTTGC 


TAAAGCGGCA 


ATGGAATCTG 


1320 




GAGTAGCTAG 


GATTGAAGTT GATCCGCAAG 


ATGTGTATGA 


TAAAACAATG 


AAACTTACAG 


1380 



55 



1160 



EP0 786 519 A2 

ATTAAAATGA TGAAAATGAA AGTTTATGAT AAACATTCAA CAGTCAAACG AATATAAATC 1500 

AAATAAATTT AAACCCGTTT TTAACTGGTC AAGTTCAGTT TAAGGCTCTA AATGGTTAGA 1560 

5 

ACAGAGGTTA TTTGGAGGTT TTCCTATGTT TAAAGATTTT TTTAATCGAA CAAAGAAAAA 1620 

GAAATATCTT ACAGTACAAG ACTCTAAAAA TAATGATGTG CCTGCAGGTA TTATGACTAA 1680 

GTGTCCAAAG TGTAAGAAAA TTATGTACAC AAAAGAATTA GCTGAAAATT TAAATGTGTG 1740 

10 

CTTTAATTGT GATCATCATA TTGCTTTAAC TGCGTATAAA CGTATAGAAG CAATTTCTGA 1800 

TGAAGGATCA TTTACAGAAT TCGATAAGGG AATGACCTCT GCGAATCCAT TAGATTTTCC 1860 

15 aAGTTATTTA GAAAAAATTG AAAAGGACCA ACAAAAGACA GGTCTTAAAG AAGCAGTTGT 1920 

GACTGGTACA GCACAACTAG ATGGTATGAA ATTTGGCGTT GCTGTCATGG ATTCACGTTT 1980 

TAGAATGGGA AGTATGGGAT CGGTTATCGG TGAAAAGATA TGTCGCATCA TTGATTACTG 2040 

20 CACTGAGAAC CGTTTACCAT TTATTCTTTT CTCTGCAAGT GGTGGTGCAC GTATGCAAGA 2100 

AGGTATTATT TCCTTGATGC AAATGGGTAA AACCAGTGTA TCTTTAAAAC GTCATTCTGA 2160 

CGCTGGACTA TTATATATAT CATATTTAAC ACATCCAACT ACTGGTGGTG TATCTGCAAG 2220 

25 

TTTTGCATCA GTTGGTGATA TAAATTTAAG TGAGCCAAAA GCGTTGATAG GTTTTGCAGG 2280 

TCGTCGAGTT ATTGAACAGA CAATAAACGA AAAATTGCCA GATGATTTCC AAACTGCAGA 2340 

ATTTTTATTA GAGCATGGAC AATTGGATAA AGTTGTACAT CGTAATGATA TGCGTCAAAC 2400 

30 

. ATTGTCTGAA ATTCTAAAAA TCCATCAAGA GGTGACTAAA TAATGTTAGA TTTTGAAAAA 2460 

CCACTTTTTG AAATTCGAAA TAAAATTGAA TCTTTAAAAG AATCTCAAGA TAAAAATGAT 2520 

35 GTGGATTTAC AAGAAGAAAT TGACATGCTT GAAGCGTcAT TGGAACGAGA AACTAAAAAA 2580 

ATATATACAA ATCTAAAACC ATGGGATCGT GTGCAAATTG CGCGTTTGCA AGAAAGACCT 2640 

ACGACCCTAG ATTaTATTCC ATATATCTTT GATTCGTTTA TGGAACTACA TGGTGATCGT 2700 

40 AATTTTAGAG ATGATCCAGC AATGATTGGT GGTATTGGCT TTTTAAATGG TCGTGCTGTT 2760 

ACAGTTaTTG GACAACAACG TGGAAAAGAT ACAAAAGATA ATATTTATCG AAATTTTGGT 2820 

ATGGCGCATC CAGAAGGTTA TCGAAAAGCA TTACGTTTAA TGAAACAAGC TGAAAAATTC 28B0 

45 

AATCGTCCTA TCTTTACATT TATAGATACA AAAGGTGCAT ATCCTGGTAA AGCTGCTGAA 2940 

GAACGTGGAC AAAGTGAATC TATCGCAACA AATTTGATTG AGATGGCTTC ATTAAAAGTA 3000 

CCAGTTATTG CGATTGTCAT TGGTGAAGGT GGCAGTGGAG GTGCTCTAGG TATTGGTATT 3060 

50 

GCCAATAAAG TATTGATGTT AGAGAATAGT ACTTACTCTG TTATATCTCC TGAAGGTGCA 3120 

GCGGCATTAT TATGGAAAGA CAGTAATTTG GCTAAAATTG CAGCTGAAAC AATGAAAATT 3180 
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GGTGCACATA AAGATATTGA ACAGCAAGCT TTAGCTATTA AATCAGCGTT TGTTGCACAG 3300 

TTAGATTCAC TTGAGTCATT ATCACGTGAT GAAATTGCTA ATGATCGCTT TGAAAAATTC 3360 

AGAAATATCG GTTCTTATAT AGAATAATCA ACTTGAGCAT TTTTATGTTA AATCGATACT 3420 

GGGTTTTACC ATAAATTGAA GTACATTAAA ACAATAATTT AATATTTAGA TACTGAATTT 3480 

TAACTAAGAT TAGTAGTCAA AATTGTGGCT ACTAATCTTT TTTTAATTAA GTTAAAATAA 3540 

AATTCAATAT TTAAAACGTT TACATCAATT CAATACATTA GTTTTGATGG AATGACATAT 3600 

CAATTTGTGG TAATTTAGAG TTAAAGATAA ATCAGTTATA GAAAGGTATG TCGTCATGAA 3 660 

GAAAATTGCA GTTTTAACTA GTGGTGGAGA TTCACCTGGA ATGAATGCTG CCGTAAGAGC 3720 

AGTTGTTCGT ACAGCAATTT ACAATGAAAT TGAAGTTTAT GGTGTGTATC ATGGTTACCA 3780 

AGGATTGTTA AATGATGATA TTCATAAACT TGAATTAGGA TCAGTTGGGG ATACGATTCA 3840 

20 GCGTGGAGGT ACATTCTTGT ATTCAGCAAG ATGTCCAGAG TTTAAGGAGC AAGAAGTACG 3 900 

TAAAGTTGCA ATCGAAAACT TACGTAAAAG AGGGATTGAG GGCCTTGTAG TTATTGGTGG 3960 

TGACGGTAGT TATCGCGGTG CACAACGCAT CAGTGAGGAA TGTAAAGAAA TTCAAACTAT 4 020 

CGGTATTCCT GGTACGATTG ACAATGATAT CAATGGTACT GATTTTACAA TTGGATTTGA 4 080 

CACAGCATTA AATACGATTA TTGGCTTAGT CGACAAAATT AGAGATACTG CGTCAAGTCA 4140 

CGCACGAACA TTTATCATTG AAGCAATGGG CCGTGATTGT GGAGATCTAG CATTATGGGC 4200 

TGGATTATCA GTTGGTGCTG AGACAATTGT AGTTCCAGAA GTGAAAACAG ATATTAAAGA 4260 

AATAGCTGAT AAAATTGAAC AAGGTATTAA ACGTGGTAAG AAACACTCAA TCGTTCTTGT 4320 

AGCAGAAGGT TGTATGACTG CGCAAGATTG TCAAAAAGAA TTATCACAAT ACATCAATGT 4380 

TGATAATAGA GTGTCTGTGT TAGGTCACGT TCAACGTGGT GGTAGCCCAA CAGGTGCGGA 4440 

TAGAGTTTTA GCATCACGTT TAGGTGGATA TGCGGTAGAC TTATTAATGC aAGGTGAAAC 4500 

40 AGCTAAGGGT GTTGGAATTA AGAACAATAA AATTGTAGCA ACATCTTTTG ATGAAATTTT 4 560 

TGATGGTAAA GATCATAAAT TTGATTATAG TCTATATGAA CTTGCTAACA AGTTATCTAT 4620 

ATAAGATTTC AGGAGGAATT ATAAAATGAG AAAAACTAAA ATTGTATGTA CAATTGGACC 4680 

AGCTTCAGAA TCAGAAGAAA TGATTGAGAA ATTAATCAAT GCTGGTATGA ACGTTGCACG 4 740 

ATTAAACTTT TCACATGGTA GTCATGAAGA GCATAAAGGT AGAATTGATA CAATTCGTAA 4 800 

AGTAGCTAAA AGATTAGACA AAATTGtAGC AATTTTATTA GATACAAAAG GTCCAGAAAT 4860 

TCGTACGCAT AATATGAAAG ACGGTATCAT TGAACTTGAA CGTGGCAACG AAGTTATTGT 4920 

TAGCATGAAT GAAGTTGAAG GAACACCTGA AAAGTTCTCA GTAACATATG aAAACTTAAT 4980 
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JO 



TAAAGATATT GACCATGCTA AAAAAGAAGT TAAATGTGAT ATTTTAAACT CTGGTGAGCT 5100 

TAAAAACAAA AAAGGTGTTA ACTTACCTGG CGTAAGAGTA AGTTTACCTG GTATTACAGA 5160 

AAAAGATGCT GAAGATATCC GTTTCGGTAT TAAAGAAAAT GTTGACTTCA TTGCAGCAAG 5220 

TTTCGTACGT CGTCCTAGTG ATGTTTTAGA AATTCGTGAA ATTTTAGAAG AACAAAAAGC 5280 

TAACATTTCA GTATTCCCTA AAATTGAAAA CCAAGAAGGT ATTGATAATA TTGCGGAAAT 534 0 

TCTTGAAGTG TCTGATGGTT TAATGGTTGC ACGTGGTGAC ATGGGTGTTG AAATTCCACC 5400 

TGAAAAAGTA CCAATGGTTC AAAAAGATTT AATCAGACAA TGTAACAAAT TAGGTAAACC 5460 

J5 AGTTATTACA GCTACACAAA TGTTAGATTC TATGCAACGT AACCCACGTG CTACACGTGC 5520 

AGAAGCTAGT GACGTTGCCA ACGCAATCTA TGATGGTACA GATGCAGTAA TGTTATCTGG 5580 

TGAAACTGCT GCTGGTTTAT ATCCTGAAGA AGCTGTTAAA ACAATGAGAA ATATTGCTGT 5640 

20 ATCAGCTGAA GCAGCCCAAG ATTACAAAAA GTTATTGTCA GATCGTACTA AATTAGTTGA 5700 

AACTTCATTA GTGAATGCTA TCGGTATTTC GGTTGCACAT ACAGCTTTAA ACTTAAATGT 5760 

TAAAGCAATT GTAGCTGCTA CTGAAAGTGG TTCAACGGCA CGTACTATCT CCAAATATCG 5820 

TCCACATTCA GACATTATTG CGGTGACTCC AAGTGAAGAA ACTGCACGTC AATGTTCAAT 5880 

TGTTTGGGGA GTTCAACCTG TAGTTAAAAA AGGACGTAAG AGTACAGATG CATTGTTAAA 5940 

CAATGCAGTT GCAACAGCTG TTGAAACTGG TAGAGTATCT AATGGTGATT TAATCATTAT 6000 

TACTGCTGGT GTACCAACTG GTGAAACTGG AACTACTAAT ATGATGAAAA TCCACCTAGT 6060 

TGGTGACGAA ATTGCTAATG GTCAAGGTAT TGGACGTGGA TCAGTTGTTG GTACTACGTT 6120 

AGTTGCTGAA ACTGTTAAAG ATTTAGAAGG TAAAGATTTA TCTGACAAAG TTATCGTTAC 6180 

TAACTCAATC GATGAAACGT TTGTACCTTA TGTAGAAAAA GCTTTAGGCT TAATTACAGA 6240 

AGAAAATGGT ATTACATCAC CAAGTGCAAT TGTTGGTTTA GAAAAAGGTA TTCCAACAGT 6300 

40 TGTAGGTGTA GAAAAAGCTG TTAAAAACAT AAGCAATAAC ATGTTAGTTA CGATTGATGC 6360 

TGCTCAAGGT AAAATCTTTG AAGGATATGC AAACGTACTA TAATTTATAA AAAAACGTCT 6420 

TTCCATTTAT CAACAATGGA AAGGCGTTTT TTGGTTcATC TGGTATTTTA TGACGTAATT 6480 

AATAGGTTAT TTGATAATGA TAGTGTATGA ATGGCAATCT ATATAAATGT TTATATCTTT 6540 

TATACATGTA CATTATCACC TTCAAACTTT CACTCATATT ACTTTGGAAA TTTATTATAA 6600 

AATAGAAGTA TGGATGTATT TCTGAAATGA TACATTATTA AATAGATGAG AAAGTAAAAG 6660 

TTTTGAGCCA AGTACGCAAT TTAATATTAT AAGTTGCATA TAAAACAGGA TGGGACATAA 6720 

ATCCCTAAAA AAACAGCAGT AAGATAATTT TCAATTAGAA AATATCTTAC TGCTGTTCTC 6780 
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tCTTCGACTG GCACTGCTCC CTCAGGAGTC TCGCCATTAA TACTACGTAT TAACATGTAA 6900 

TTTTACTTTT ACATACTTTA AAAAAATAAA ACACTTTGCC CAACTTGCAC ATAAATGTAA 6960 

5 

AATTCAATAA AATGAATTTT CTGTGTTGGG TCCCTTCGTA TAATTTAATA AATACCACTA 7020 

AACTAAATTA ACGAGGTGCC TTATGTATAA AATTTATAAC ATGACCCAAC TTACACTACC 7080 

w AATAGAAACC TCTGTTAGAA TTCCTCAAAA TGATATTTCG CGATATGTTA ATGAAATTGT 7140 

TGAAACGATA CCTGATAGCG AATTCGATGA ATTCAGACAT CATCGTGGCG CAACATCCTA 7200 

TCATCCAAAA ATGATGTTAA AAATCATCTT ATATGCATAT ACTCAATCTG TATTTTCTGG 7260 

15 TCGTAGAATA GArAAATTAC TTCATGACAG TATTCGAATG ATGTGGTTAG CTCAAGATCA 7320 

AACACCTTCT TATAAAACTA TTAATCGTTT TAGAGTGAAT CCTAATACTG ATGCGTTAAT 7380 

TGAATCTTTA TTTATTCAGT TCCATAGTCA ATGTTTAAAG CAAAATCTTA TTGATAATAA 7440 

TTCAATTTTT ATTGATGGTA CAAAAGTAGA AGCTAATGCC AATAGATATA CATTTGTGTG 7500 

GAAGAAAAGT ATTCAAAATC ACGAATCGAA ATTGAACGAA AATTCAAAAA CATTATATCG 7560 

TGACTTAGTT GAAGAAAAAA TAATACCAGA GATAAAAGAA GATGGAGATA GCGATTTAAC 7620 

25 

AATAGAAGAA ATAGATTTAA TTGGTAGTCA TTTAGATAAA GAAATCGAAG ATTTAAATCA 76 80 

TTCTATTGAG AACGAAGATT GTGCTCAAAT TAGAAAACAG ACCCGTAAAA AAATAACTGA 774 0 

GATTAAGAAG TTCAAAAAGA AATTTGATGA TTATTCCGAA AGAAAAAATA AATATGAAGA 7800 

30 

ACAAAAATCG ATTCTTAAAG ATAGAAATAG TTTTTCTAAA ACTGATCTGA TCATGATGCA 7860 

ACTTTTATGA GAATGAAGGA AGACCATATG AAAAATGGCC AACTTAAGCC AGGATACAAT 7920 

35 TTACAAATAG CGACAAATTC TCAAAAATGT TTTATCCTAT GACCTATTTC AA 7972 

(2) INFORMATION FOR SEQ ID NO: 313: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3175 base pairs 
40 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

45 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 313: 
ATTTTTTAGT TAATTGTCTT TCTTAAAATA ATTTTAGCTT TCATTAAATT AAACAATTTT 60 
ACAAGCTTGG AACACCAATC AAAATCCTAA GTTCTAAAAT GCAATATTAG TAGTCGTTGA 120 

50 

CTGAATGAAC ATATGCTTAT AATATTTTTT TGCAATGCTA GTCAAGTTGA TTTATGCTCA 180 
CAAGGATATG CGATTTATAT TTTCTTACAA CAATGAAAAT GCCTGATACA ATGCGATCCT 240 
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AATTAAATTA TTGTTGTTTT AACCATTGTA 
CTTTTGGACC ATTATATGAA GCTTTATTAG 
5 TGTGAGGTGT TTGACCACTA AAATGTGTTA 

GTCCATTCGT ATGGTTAACT AAATCAGCGA 
TTGCAGTAAT CGGTAATTCA AATACCATTT 

10 

CGTTTAATAT CACTTTACTA TTCGATTCAA 
CAATTGCTGC ACCCGTTAAT GTAGCAAAGT 

?5 CATAAAACAC AGCATCTGCA AGGACTAATC 

CAGTTTCACC ACTTAATGCT GTAAATACAT 
TATTTTCAGC ACACGCAAGC ACTCCGACAA 

20 CTTCAATGAT ACCAACGACA TTCGCAGCGC 

CATTCTTCGT TTTAATACTA TAACCACCAG 
CAATTGGTGC TTCATCTTTG TCTTTGCCAT 

25 GCTTACTACC TTTACCTACT GCTTGTAAAA 

AATCTTTAAC ATCTACTTTG ACCTTTGTAT 
ATGTTTGTGG TGtTAATACA TTCGGTGGCA 

30 

aTTGGcCAAT ACTGATACCC TCATGAATAA 
GGkTTAAATT CGTCTTAAAC GGtGCCTTCT 
kTGcACGCTC ACTTTGGAAT ACCGCATGCC 

35 

TTTGgAnATA AATGaATCCa TAAGTAAATA 
TTGGAAAAGA TGTCCCCaTA TTTTCAACAT 

40 AAACCAACTG TAATTAAACG ATATGTTTGA 

TTCCCAACTT TACTACCAAT AATATGTTGA 
TCGATATGAT TAAAACTAAT GCGCTCTAAC 

45 AATGTATTTA TTTCGTTGCT TAGTGTGTTA 

AGATTTGATA TGTTACTCAC TTCAAATTGT 
GACTTTATAA ATGAATAATT TAATTTTATG 

50 

AATTTACCTT TTTTGAATGC TAAACCGATA 
ATCACTTTTT TCATGAATGC TGCTTTTTTA 

55 



CTATCGTCGG AATCATAAAT 


CCTGTTGGCC 


360 


TCGTTGCTGG 


ACCTGCAATA 


TCGAAATGAA 


420 


CAAAACTTGC 


CGCAAATAGC 


GCTTTACCTT 


460 


TATCACTGTG 


TTTAATACTT 


GCACGTTCGG 


540 


CATCGACTTC AGAACTTATT 


TGTAATATAT 


600 


ATGCAGCAGC 


TTTATCATCG 


CCTAGTGCAa 


660 


CCATAATCAC 


ACTAGGCTGA 


TATTGATTTG 


720 


TACCTTCAGC 


GTCTGTATTC 


ATTACTTCTA 


780 


CATCTGGcTT 


CATTGATGCT 


TCATTTATCA 


840 


TATTTACAGG 


CAGTTGTAAA 


CGAcTAGCCG 


900 


CACACATGTC 


AAACTTCATT 


GTAGCCATGC 


960 


AATCATACGT 


TATACCTTTA 


CCAACTAAGG 


1020 


TATATGTGAT 


GGTTACTAAt 


CTCGGTTTAT 


1080 


GTCCGAATCC 


TTCAGAAACT 


AAAGTGTCAT 


1140 


TTTTAAAATG 


ATTAACAATA 


TCTTCTGCAA 


1200 


TATTACTAAA GTCTCyTGcC AAATTAATGG 


1260 


AATCTAATTC 


AATTAATGAT 


TCACTAATAA 


1320 


JcACTTgrTTT ATAATGATCG aATyCATATG 


1380 


ATTAATACAT CTGgATAACT GgATCcATAT 


1440 


CGTATCTTCa 


ATGTGTTCTG 


ACTTTATGTA 


1500 


ATCTTGATAA 


tACGTGTCTT 


TAAGTTTCCT 


1560 


TCTTGTACAT 


CAAATGCAGT 


TGTATAAATC 


1620 


TGTTTTAGTC 


TTTCAAGTGA 


TTCTGTAATA 


1680 


TGATTTAAAT 


GTTCTGGTAT 


ACCAATAATC 


1740 


TTTAATTTAA 


AATTCATAAT 


GTACCTCCTT 


1800 


ACAACAATAA 


AGCCCTcAGT 


GACACTGAAG 


1860 


TGTTTAGCTG 


AAACTTTATT 


TAAAGCCTAG 


1920 


CCACCGATTT 


TGAATACCGC 


ACGTGTATCA 


1980 


CCAGCGATAG 


GTTTACCAAA 


TACCATACCT 


2040 
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GTTGATTCAC CGTTTAAGAT GCGTTTAATG TTTTTAGCAA CACTTTCACC TTGTTGCATT 2160 

GCAATTTGTG CTGTAGTTGG TAATGGACGT TCTTCTCCAG CTGGGATAAA CGCTGAACAG 2220 

TCACCAATAA CAAAAATGTT GTCGTAACCA TTGATTGTTA AATCTTGCTT TGTAACGATA 22 80 

CGTCCACGTT TAACGCCTTC AAATGATTCT TCCATTAATT TACTACCACG TACACCAGCT 2340 

GCCCATACTG AAGTACCTGC ATTTAATTGT TGTTTTTCAC CATCTACTTC AACTACAAAA 24 00 

CCTTTTTCGT TACAAGCAAC GATTGGTGTA GCAATTTTAA ATTCAACACC GCGGTCTTCT 2460 

AAGTAGCTAA cTGCGTGGTT AACTAATTCT TCTGAGAACA TTGGTAACAT TTTAGGTGCT 2520 

GCTTCAACAC AAGTGATTTT AACTTTATTT TGATCCACAC CATATTTGCT ACATAATTCA 2580 

GGAATTCTGT CTGTTAATTC ACCTAAGAAT TCAACACCAG TGAATCCAGC ACCACCAACT 2640 

AAGATAGATA AATCGTTATC ATCTTTTTCT TTTGATGCTG CATAGTTAGC AAATTTGTCT 2700 

20 TCGATATGAC GTGATAATTC ACGTGCTGTG ATAACATTTT CAATTTGGAA AGCATGATCT 2760 

TTCATACCTT CGATGCCGAA TGTTTCACTA ACGAAACCTA ATGCTACTAC TAAAATATCA 2820 

AAGT CAT AAA TACCTTGATT TGTTTCTACC TTTTTAGCAT CACGGTCAAT TTTTGTTACT 2880 

TCTGCtTGAA CAAAGTTCAC TTTGTCTTTC TTCAAGACAC TTTCCACAGG ATATAATACA 2940 

TCTTCATAGT TTAGTGTACC TGCTGATGCT TCATGTAACC ATGTTGCTTC ATAGTGATAT 3000 

TCATTTTTAT TAATAAGCGT AATTTCTGCT TCTTCTGTTG ATATCGCTTT TTGCAATTTA 3 060 

GTTACAGTTT GTAAACCTGC ATAACCAGCA CCAAGTACAA GTACTTTTTT ACGATCTTGA 3120 

GCCATTTAAT TnCACCTAAG CnTTCATATT TTTTTAACCA AATGCTGATA ATTAC 3175 
(2) INFORMATION FOR SEQ ID NO: 314: 

35 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 702 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
40 (D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 314: 

CATCATTATT AAAGATTTTC AATCAATACA gAATCACAAT ACGTACGCAT TGTGCACGAT 60 

AAAAATACAG ATGTGTATAT TAACTATGAA CTACAAGAGC AACTAACGAA CAAAGCTTAC 120 

ATTGGTGATC ATATTTATGT TGAAGGGATA TGGCTCGAAG TACAAGCTGA TGGTTTAAAT 180 

GTATTGAGTC AGAATACAGT GGCATCGTCA TTAATTCGCT TAACACAAGA GATGCCACAT 24 0 

GCACAGGCAG ATGATTACAA TACGTACCAT CGTTCGCCAA GGATTATTCA CCGTGAACCG 300 
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TGGCGTTCCA TTATACCGCC ATTAGTAATG ATTGCTTTAA CTGTTGTCAT CTTTTTAGTG 
AGACCAATTG GTATTTATAT TTTAATGATG ATTGGTATGA GTACAGTAAC GATAGTATTT 
GGTATTACAA CGTATTTCTC TGAAAAGAAA AAGTATAACA AAGATGTTGA AAAACGAGAG 
AAAGATTACA AAGCTTATTT GGATAATAAA TCTAAAGAAA TTAATAAAGC GATTAAAGCA 
CAACGTTTTA GTTTGAATTA CCATTATCCA ACGGtTGCTG AAATTAAAGA TATCGTTGAA 
ACGAAAGCAC CAAGAATATA TGAnAAAACC ATCGGCATCA TC 
(2) INFORMATION FOR SEQ ID NO: 315: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4121 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 315: 
TATGTTCCGA CAACGAAACA AAGTGTAATT ACAAGAGCAA AGATAACTTT GAATGTTTGT 
AAACGTCCAT CTTTACCTTC AGTTAAATGC ATGAACATTA ATAATTGArG TCCTGCTTGG 
ACGAATGCAA AGCCAAAGAT AATTGTCAAC TTCGCGTGGA ATGTTAATGA CGTGTATAGT 
GTTACGTAAA CTGCTAAAAG CGTTAATACG ATAGATGCGA TAAATCCTAC AGTATGTTTC 
ATTATTGTAC TCATCCGCTA TACACCATCC CTATCATATA TACGGCAGTA AAGATGAAAA 
CCCAAACAAC ATCTAAGAAG TGCCAGTATA AACTTACTAT AAATAATTTT GGCGCATTAT 
ATTTGTCTAA TCCGCGTCGT TGGATTTGGA TTAATAAACA AATGGCCCAA ACGATACCTA 
GCGATACGTG ACAACCATGC GTTCCTAATA GGATAAAGAA ACTAGACCAG TAAGAACCAA 
TTGTTGGGTT AACGCCTTCT GATGCATAGT GTGCGAATTC ATAAATTTCG AATCCAACAA 
AGACTAAACC TAAAAGTAAC GTAATGATCA TCCAAAACAT CATTAACTTT TGTTTTTCTT 
GGCGCATGTA GTAAATAGCA ATACCACATG TGTAAGAACT GAATAATAAT GCAAACGTCA 
TTATTAAAAC AAGAGGCAAT TCAAATAACT CAGTAGTCAT TTTACCTGCA TAATCGCCAC 
CATGTTGCAA AGTTAATAGT GTCGCAAATA GGGTACCGAA TAACGCAAAT TCGGCTGTAA 
TGAAAATCCA AAAGCCAAGC TTATTTAATT CGCCTTCATG TGTGCGTGAA TCAATAGTGT 
TTGTATCATG ACTCATGACT TACAGCCTCC CTTTCTTTAA TACGCGCTTC TCTTAATCTA 
GCTTCAGTTT CTGCAACTTC AGCAGCAGGG ATATGATATC CGTGATCGAT TTGGAAACTG 
CGATAAATCA TAGTACCAAA AATACCGAAT AAACAAATTA ATGCTGGAAT TACAGTTTCG 
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TTGTTTGGCA TATGAATGTC TTTGTAATTA TGGTTGTCTA AGTAATGACG ACCATGTTCT 1140 

TTCATATCAA CAAATGTGTC GTAGTCATTC CAATCTGGTG TAATGGCAAA GTTGTATTTA 1200 

GGTGGAATTG CTGATGCAGT AGTCCACTCT AGAGTACGAC CAAGGCCATC CCAGTTATCT 1260 

CCAGTTGCTT CACGTGGAGA TTTGAAGTGA CTGTATACGA TACTAACAAC AAGGAATAAG 1320 

AATCCGATTG CCATTAATAA TGCACCGATA GTTGAAATTA AGTTTAATAA GAACCAACCA 1380 

TCTGATGGCA TATAAGTGTA TAAACGACGT GGCATACCAT CTAATCCAAG AATGAATTGT 1440 

GGTAAGAAAC AAACGTTAAA TCCGATCATG AAGAACCAGA AGCACCATTT GTTTAATGTT 1500 

15 TCGTTTAATT TGTAACCCAT CATCTTTGGA TACCAGAAGA TTAAACCAGC TAAGCAGGCA 1560 

AATACAACAC CAGTAACCAA TGTATAGTGG AAGTGAGCTA CTAAGAAGTA CGTATTGTGA 1620 

TATTGATAGT CAGCTGATGC CATTGCTAAC ATTACACCCG TAACACCACC TAAAAGGAAG 1680 

20 TTAGGGATAA ATGCTAATGA GAATAGCATT GGTGACTCAA ATGTAATACG TCCTTTATAT 1740 

AATGTTAATA ACCAGTTAAA CAATTTCACA CCAGTTGGAA TACCAATCAG CATTGTTGAA 1800 

ATTGAGAAGA ATGAGTTGAT TAACGCACCA TTACCCATTG TGAAGAAATG GTGAACCCAA 1860 

ACTAAGAAAC TAAGGAACGC GATACCGGCA GTTGCCCATA CCATACTTTG ATGTCCGAAT 1920 

AAACGCTTAC GAGCGAATGT CGGGATAATT TCTGAGTAAA TACCAAATGC TGGAAGGATA 1980 

ACGATATAAA CTTCAGGGTG CCCCCATACC CAGAAGAAGT TAGCCCAAAG CATTGGCATA 2040 
CCGCCATGTG CAACTGTGAA GAATGCTGTG TCAAATATTC TATCAGTTGT CATTAATGCT • 2100 

AACGCTACTG TTAAAGGAGG GAAAGCAAGA ATAACAATTA ATGTAGTAAT AAATGTTGTT 2160 

ACTGTAAACA TTGGCATTTG CATAAACTTC ATAGTTGGTG TTTTACATCT TAAAATTGTT 2220 

ACAAAGAAGT TGATACCTGT AGCTAAGGTA CCAAGCCCTG AAATTTGTAT AGCTATTAAG 2280 

TAATAGTTAA CACCCGGACC AGGACTGAAT TCACCTGCTA GTGGCGCATA GTTTGTCCAA 2340 

40 CCAGCTGCTG GTGAACCACC AATAATAAAT GACAGGTTGA ATAAAATCAT ACCTGCAAAG 2400 

AATAGCCAGA AACTTACGTT GTTTAATACT GGGAATGCAA CATCACGTGC TCCAATTTGT 2460 

AATGGAACAA CGATATTCCA TAAACCAAAG ATAAATGGCA TTGCCATGAA GATAATCATG 2520 

ATTACACCAT GTGTACTAAA AATTTCGTTA TAGTGGTTAG ATTCTAAAAA TTTGTTATCA 2580 

GGTACTGTTA ATTGCGCACG AATAAGTAAC GCATCAATAC CACCACGGAC GAACATTAAT 2640 

ACGGCACAGA TTAAATACAT AATACCGATT TTCTTATGGT CTACAGATGT GAACCATTCT 2700 

TTGTAAAGAT ATTTCCATAA TTTAAAGTAA GTAATTACTG CGATTAAACC AATAACTAAG 2760 

AATGGGGCAC CAATTTGTGC CATTGTAATC ATcCAGTTAC CTTTAACTAG TAATTGATCC 2820 
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TTGAAATTTT CTTCATTTCT TTCGCATTTT TCGATTCATC TTTCTTGAAC TCATTGTTAT 2940 

ATGGTTCGTC ATTTCCAAGA ATCATCAACT TCATACCATG TCGTTTATAG TTCGCATTTG 3000 

TAATTTGAGC TTTACGAGCA GGTATTAATG GTTTGTCTGA TACATCTTTA AACATATTTT 3060 

CTTCACTAGT GAAGTTTGGA TCTTTCAATT CGAAATTGAA ACGTTTATAT GCATAGAAGA 3120 

TGTATTCTGG ATCGGCTGCT GGATCAACAA ACGCCATATG TGTACCATTA AATTCTAAAG 3180 

CTTTATTAGG TGTGCTTGGT AATAATTGTT TATCAAATGT ATCTTGATCT AACGTTTTCT 3240 

TACCTTTAAC TTCTTTCACC CATTTGTCGT AGTCTTTTTG ACTAACGGCA TTTACTTTAA 3300 

ATGTTTGACG TGAGAATCCT TCACCATTGA AGTTAGAGTT ACGACCTCTG AACGTACCAG 3360 

TTTGAGATGC TTCTAACGTC CAATTCATTG TCATGCCAGT CATGGCATAT TTTTGACCAC 3420 

CTAATTGTGG AATCCAGAAA CTTGTCATTG TATCCATAGC TTGAAGCTTA AATACAACAG 3480 

GACGATCTTT AGGGATTGTT AATGTATTAA CAGTCTCTAT ATGTTCATCT GGATAAGCAA 3540 

AGAACCATTT GTATCCTGCA CTTACTGCAT ATACAACCAT TGGATCTTTC TCACTCTTCG 3600 

GTGGTTTTTC GTAATCGTAT AAAGTTTTAA CTGTAGGAAT AGctAAAGCA GCAACGATTA 3660 

TGATAGGTAT TACAAACCAT ATTGTTTCAA TGATGGCATT ATGGTGCATC TTACCAGATT 3720 

CGGCATTCTT ATTATAACTA TACTTGTAAA TAAAAATGGC GAACATGCCA AGTACAACGA 37B0 

AACAAATAAC AAGCATGAAG ACGATTGAAT AAAGAATCAA GAACTTCTGA CTACTTGCTA 384 0 

CTGGCCCTTT TGCGTTGAAA ATTTCTATAT TTGAACAACC ACTAAGTAAA ATTAGTGTGC 3900 

CAAATAATAG AAGCAAAGAC TTAAATTTTG ACACTTTTTT GACCTCCTAA TACTACAAAT 3 960 

GTAGGGCTTA ACATTAATTT TAAGTTATTA CACAATATTT ACAAGGGCTT ATGGGAAAAA 4020 

AATTAATAAA ATTGTATCAA AAATGTTGAT AAATCAAGGT GTGACGTGGG TTCACACATT 4080 

TGTTAAAATT ATGTGTACAT TTTGTGACTA ATAGCGTTTT T 4121 
(2) INFORMATION FOR SEQ ID NO: 316: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 9310 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 316: 
so CGAGTGAGTA CAmACATATT TTTATTTGCA AGGGGTAAAT GGCATATAAC TATCTTTTTT 60 

ATGTAAGCTG GTATAAAATT TATACTAATA GGAGGGATAG TATGAATATA GTAGGGCATC 120 
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TTGGATTACG 


ATTAGTTGAA AAGTCGGTTA 


ATCAAGACAA 


TCCTTCAATG 


TATCATTTGT 


240 




TTTATGGGGA CGAAgTAGGT ACAGCCGGAA 


CAATTTTAAG 


CTTTTTTGAA 


ATTCCCAATG 


300 


5 




vjQ_AGCCAGGT ACTGAAACGA 


TTTATCGATT 


TTCATTATTA 


GTACCAAATC 


360 






i 1 1 a i in gaaaaacgtc 


TTGAGAATAA 


TGGTATTAAG 


TCTGAACGTT 


420 






lGUACAAGAA GGTGTTGTCT 


TTAAAGATGA 


AGACGACTTA 


GAAATCATAT 


480 


10 




TGATAGTTTT GAAGTACCAC 


ATCAATGGCA 


ACATAACGCT 


TATAGTGAAA 


540 




1 At. LTI CAAGC 


atatcaaatt ttaggaatag 


GGCCAGTCGA 


ATTAAGAGTT 


AGAAATGCAG 


600 


15 


t-GCGTACGGT 


AGAATTTTTG GAAAATGTCT 


TAGGTTATCG 


CAAAAGAGAT 


AATAAATCAT 


660 


TCGATGTGCT 


GACATTAGCA CCACAAGGTT 


TATATTCGGA 


TTTTGTAGTT 


ATTGAGCAAC 


720 




AGGGACAACG 


TGAAAGACCT GGACGAGGTT 


ATATCCATCA 


TATTGCAGTT 


AATACACCAC 


780 


20 


AAATGAGTGA 


CTTAGATGCA ATTTACAAGA 


AATTACAACA 


ACAACCACAA 


AGTAATTCAG 


840 




GTATAATTGA 


TCGCTATTTC TTTAAATCAT 


TATACTATCG 


CCATAATTCA 


ATTATGTATG 


900 




AATTTGCGAC 


TGAAGCGCCT GGATTTACTA 


TTGATACACC 


TGTTGAACAA 


TTAGGAAGTC 


960 


25 


AATTGAACTT 


GCCTGACTTT TTAGAAGCAG 


AACGTGAACA 


AATTGAAAGT 


AAGTTACACG 


1020 




AAATATAAAG 


GAGAATGTTT AATGGCCAAA 


TTAGAAATGA 


ATAAAAATAC 


GCCTCTTGAG 


1080 




TTTGGTTTGT 


ATTCCTTAGG TGATCATTTA 


TTGAATCCAT 


TGAAAGGTGA 


AAAAGTTAGT 


1140 


30 


TATGAGCAAC 


GTATTAATGA AATTATTGAA 


GCAAGTAAAT 


TAGCAGATGA 


AGCAGGTATT 


1200 




GATGTTTTTG 


CAGTTGGTGA AAGTCATCAG 


GAGCATTTTA 


CAACACAGGC 


ACATACGGTT 


1260 




GTGTTAGGTG 


CAATTGCCCA AGCGACAAAG 


CATATTAAAG 


TTTCAAGTTC 


TTCAACGATT 


1320 


35 


ATTAGTGCAC 


AGATCCTGTA AGAGTATTTG 


AAGACTTCGC 


GACATTAGAT 


TTGATTTCTC 


1380 




ATGGTAGAGC 


CGAAATTGTA GCTGGCAGAG 


CATCAAGAAC 


AGGTATTTTT 


GACTTGTTTG 


1440 


40 


GCTATGATTT AAAAGACTAT GATGAATTGT 


TTGAAGAAAA 


ATTAGGTTTA 


CTTTTAGAGT 


1500 


TAAATAAAAC 


TGAGCGTATT ACTTGGTCTG 


GAAAATATCG 


TCCAGAACTT 


AGAAATATGA 


1560 




AAATATTCCC 


AAGACCAATC GATAATATAT 


TGCCAATATG 


GCGTGCTGTT 


GGTGGTCCAC 


1620 


45 


CTGCAAGTGC 


TATTAAAGCG GGAAAACAAG 


GTGTGCCAAT 


GATGATTACA 


ACCCTTGGTG 


1680 




GCCCAGCAAT 


GAACTTTAAA GGTTCTATAG 


ATGCTTATCG 


TCAAGCGGCA 


ACTGAAGCAG 


1740 




GTTTCGATgc TTCGCCTAAG TCTTTACCAG 


TAAGTACAGC 


GAGTCTGTTT 


TATACAGCTG 


1800 


SO 


AAACAACTCA 


GGATGCTATG AGAGAATTTT 


ATCCACATTT 


GAATACAGGG 


ATGTCATTTA 


1860 




TTCGTGGTGT 


TGGTTATCCG AAACAGCAAT 


TTGCTAATTC 


GTCAGATTAT 


CGAGAAGCGC 


1920 
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GTCATCAACG TTTTATGGCA CAGCTTGATT TTGGCGGTGT GCCATTTGAA AATGTTATGA 2040 

AGAATATTGA GTTAATTGGC AACGACATTA TACCGGCGAT TAAAAAGCAT TTATCAAAAT 2100 

5 AGGAGGGGCG TCATCATGAA TATTGTATTA TTGTCAGGTT CCACAGTAGG TTCTAAAACG 2160 

AGAATTGCTA TGGATGATTT AAAAAATGAA CTAGAAGTCA TCAATGAGGG ACATCAAATA 2220 

GAGTTGATGG ATTTACGAGA ACTTGAATTA GAATTTAGCG TTGGAAAGAA TTATCTAGAT 2280 

10 ACTACAGGAG ATGTATATAA ATTAACGACG TCGTTAATGC AGGCTGATGT GATTTTTATT 234 0 

GGTTTTCCAA TTTTTCAAGC TTCCATCCCT GGTGCTTTGA AAAATGTGTT TGATCTACTT 2400 

CCAGTCAATG CGTTTCGTGA CAAGGTAATA GGACTTGTAG CGACAGCAGG TTCTAGTAAA 2460 

15 

CATTATTTAA TTCCTGAAAT GCATTTAAAA CCAATATTGA GTTACATGAA AGCACATACG 2520 

ATGCAAACGT ATGTATTTAT TGAAGAGAAA GATTTTTCAA ATCAACAAAT TGTCAATGAT 2580 

GATGTTGTAT TTCGGTTAAA' AGCGTTGGCA CAATCCACAA TGCGAACTGC CAAAGTACAA 264 0 

20 

CAACAAGTGT TTGAAGAAGA AAACAACCAA TACGACTTTT AAAGTATAAA AATAAGACGC 2700 

TCGGCACACT AAATTTGTAA GTGTTTGAGC GTCTTTTCAT ATTAACTATA TAGCCAATGA 2760 

25 ACGACGATAA AGGCAAGTGA TGACAAGCAT ATTGAGGTAA TAATGATTGT CATAAGCGGT 2 820 

TTAAGTGCGC GATTTTTAAG ATCTTTAAAT GCAACATTTA ACCCTAAAGC AACCATGGCC 2880 

ATTAATAAGC AAATTGTTGA TACAGTATTT AAAATATTTA GCAATGCTGA CGGAATAGTT 2940 

30 ACATATGTAT TCACTAAGGC CATAATGACA AATCCAATTA AAAAGTATGG AATGCTTATT 3 000 

CGACCCTTGC TAGATGATTC TGATGAACGG AAACGCATAA TTAAAATAAG TACGATGGTT 3060 

AATGGAATCA GTAAGAATAC TCTACCAAGT TTACCAAGAA GTGCAATTTT AAGTGCATCA 3120 

35 CTACCACCAA AGCCACCAGC TAAGACAACG TGTGCAATTT CATGAAGACT AACACCAGAC 3180 

CAAGCGCCAT AAACATTTGT CGTCATTGAA AAGATAGCGT AGATAGCTGT ATATATAAGT 3240 

GAAAATATCG TACCAATCAA TGCGATGATA CCGATACTAA TAGCTGTATC CTTTTCACGT 3300 

40 

GATTTGAATA TTGGAGCGAC TGCGGCAATA GCAGCAGCAC CACAAACGCC TGTGCCGACA 3360 

CCTAGTAATA ATGCGATGTT TTTGTCACCA TGCAACAGTT TGTTGACAAA GAGCATCATT 3420 

ACAATACTGA AAATAACGAC ACCTACATCG ATGGCTAATA GTTTACTACC TTGACCGATA 3 4 BO 

45 

ATATCGAATA TATTGAGTTT. AAGTCCATAT AGGATGATTG CAAATCTTAA TAAATATTTA 3540 

GATGAAAACG TAATACCTGA GCTATATTGT TCAGGATATC CTCTAAAGTG ACGATATAGA 3600 

so ATAGCGATTA ATATCGCGAT AGTTAATGCG CCAACCTTAT CTAGGATTGG CAATTTAGCT 3660 

GCTAAAAAGC TAAATAATGC GACTATAAAT GTTAGTGATA GCCCAATCAT AAAATGCTTA 3720 

55 
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ATTTTTAAAT ATAAATTTGG AATGAATAAT AAAGTAGTGA TTAAATTAAG TTGTGTGATA 3840 

GGAAACTTGG ACATCAATCA AAGTAATAGG CACTACAACG CTTATTGGCG GGGCCCCAAC 3900 

5 AAAGAAGCTG ACGAAAAGTC agCTTGcAAT AATGTGCAAG TTGGGGATGG GCCCCAACAT 3960 

AGAGAAATTG GGTCCGTAAT TTCTACAGAC AATGCAAGTT GGCGGGGCCC CAACATAGAG 4020 

AATTTCGAAA AGAAATTCTA CAAGCAATGC AAGTTGGGGA AGGACAACAA ATTTAAGATA 4080 

10 

CAATGCGTAA CATTAATATG TTATTATAAT GATAATTTAC AGAATTATAT GAAAAATGAA 4140 

TGAGGATGTG ATGGTATGTT TGGAATGAAA GTGAATGAAC AAATAACATT AAAAATTTTA 4200 

GAAGCTCATG ACACAGAAGC GCTTTTCAAT TTAGTCAATC GTTCAAGAAA TTCACTTAGG 4260 

75 

GAATGGTTAC CTTGGGTAGA TGCAACTGAG CAACCATCAG ATACGCGTGC ATTTATTAAA 4320 

AGAGGACTTT TGCAATTTGC TGATGGTAAT GGATTTCAGT GTGGCATTTG GTATGAAGGA 4380 

20 ACGCTAGTTG GTGTCATCGG TTTACATGAA ATTAATCACA TGCACAGAAA AACTTCATTA 4440 

GGGTACTATT TAGATAAAGA ATTTGAGGGT CATGGGATTA TGACACAAGC AGTTGAGGCA 4 500 

TTGATAAAGT ATTGTTTCGA AGAGCTTGAC TTAAACCGAA TTGAGATTAG TGCCGCAGTT 4560 

25 . AATAATGAAA AAAGCCGGGC TATTCCTGAA AGGCTGGGAT TTACTAGAGA AGGTATGTTA 4620 

CGTGACAATG AATTACTAAA TGGTATTTAT TCATCGAGTT ACATCTATAG TTTATTAAAA 468 0 

TCAGAATACG ACCAAAAATG ACAAATTAGA CTTACAAAAG AGTGATGACA TTTAAAATGG 4740 

30 CAGCGCTCTT TTATTTAATT TTTGAAAATA AAAGGTTGTT GACAGTATTA TTTTATAACA 4800 

ATATAATGAT TTTGATAATT ATTATCAACT AGATGATGTT TATGGGAGGA TGCTTTAAAA 4 860 

CAGCCGTTTT AAGTGTAATG TATTATTTTA GCGTGTAGGG AATGCGAAAA TAATATTTAT 4 920 

35 

AAGAACACAT CTATGGGGAT AATAGAATTT CTATAATGAG GTCTCAAAAT GAAAAAGTTA 4 980 

ACAACGCTAT TATTAGCATC AACGTTATTA ATTGCTGCAT GTGGGAACGA CGATAGTAAG 5040 

AAGGATGATT CAAAGACATC GAAAAAAGAT GATGGTGTTA AAGCAGAATT AAAACAAGCA 5100 

40 

ACAAAAGCAT ATGATAAATA TACTGATGAA CAGTTAAATG AATTTTTAAA AGGTACAGAA 5160 

AAATTTGTTA AAGCGATTGA AAATAATGAT ATGGCCCAAG CAAAAGCGTT ATATCCAAAA 5220 

4$ GTTCGTATGT ATTATGAACG CTCTGAACCA GTTGCAGAAG CATTTGGAGA TTTAGATCCT 5280 

AAAATTGATG CACGTCTTGC AGATATGAAA GAAGAGAAAA AGGAAAAAGA ATGGTCAGGA 534 0 

TATCATAAGA TTGAAAAAGC ATTATACGAA GATAAGAAAA TTGATGATGT GACTAAAAAA 5400 

50 GATGCACAAC AATTATTGAA AGATGCAAAA GAATTGCATG CCAAAGCTGA TACATTAGAT 5460 

ATCACACCAA AATTAATGTT ACAAGGTTCT GTTGACCTAT TAAATGAAGT TGCAACTTCT 5520 

55 
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GTTGAAGGCG CACAAAAAAT TTATGACTTA TTTAAACCTA TTTTAGAGAA AAAAGATAAA 5640 

AAATTAAGTG ATGATATCCA AATGAACTTC GATAAAGTGA ATCAATTATT GGATAAATAT 5700 

AAAGATAACA ACGGCGGTTA TGAGTCATTT GAAAAAGTAT CGAAGAAAGA CCGTAAAGCA 5760 

TTTGCGGATG CTGTTAATGC ATTAGGAGAG CCACTAAGTA AAATGGCTGT GATTACTGAA 5820 

TGACAAATTA TGAACAAGTT AACGATAGTA CGCAATTTTC AAGACGTACA TTTTTGAAAA 5880 

TGTTAGGTAT TGGCGGTGCC GGTGTTGCAA TTGGCGCAAG TGGTGTTGGT AGCATGTGGT 5940 

CTTTCAAATC AATGTTCAAT ACACCAGAAG ATCCGGAAAA AGATGCGTAT GAATTTTATG 6000 

GTAAAGTGCA ACCAGGCATT ACCACACCCA CGCAAAAAAC ATGCAATTTC GTTGCGTTAG 6060 

ATTTGAAGTC AAAAGATAGA GATGCAATTA AGGCAATGTT TAAAAAGTGG ACGGTTATGG 6120 

CTGATCGTAT GATGGATGGT GATACAGTTG GCAAGCCGAG TAACAATCCT TTAATGCCAC 6180 

CAGTAGATAC CGGTGAATCG ATAGGATTAG GTGCAAGCAA GTTAACGATT ACCTTTGGGA 624 0 

TTAGTAAGTC TTTGATGAAG AAAATTGGGT TATCTAGTAA AATTCCCGAT GCCTTTAAAG 6300 

ATTTACCGCA TTTTCCGAAT GATCAGTTAA TAGACGATTA CAGCGATGGT GATATTATGA 6360 

TTCAAGCATG CTCAAATGAT TCGCAAGTAT CCTTTCATGC GGTTCATAAT TTAGTTCGTC 6420 

CATTTCGAGA TATTGTTAAG GTACGTTGGG CGCAATCTGG TTTTATCTCT GCTAAAGGTA 64 80 

AGGAAACACC TAGAAATTTA ATGGCATTTA AAGATGGAAC AATTAATCCT AGGAAGAATA 6540 

30 ATCAACTTAA AGATTATGTG TTTATTGATG ACGGATGGGC GAAACATGGA ACTTATTGCG 6600 

TTGTCAGACG TATTCAAATA CACATTGAAA CGTGGGATCG TACTGCGCTG GAAGAACAAG 6660 

AGGCTACATT TGGTCGGAAA CGACATAGTG GTGCACCGTT AACAGGTGGG AAAGAGTTTG 6720 

ATGAAATTGA CTTAAAAGCG AAAGATAGTC ATGGCGAGTA TATTATTGAT AAAGATGCCC 6780 

ATACGAGGCT AGCGAAAGAA GCAAATACGT CAATTTTACG TAGAGCCTTT AATTATGTGG 6840 

ATGGTACGGA TGACCGCACA GGTAACTTCG AAACAGGCTT ACTTTTTATT GCTTTTCAAA 6900 

AAGCGACAAA ACAATTTATC GATATACAAA ATAATTTAGG TAGTAATGAT AAATTAAATG 6960 

AATATATTAC ACATAGAGGT TCTGCTTCAT TTTTAGTATT ACCAGGTGTT AGTAAGGGAG 7020 

GATACCTTGG TGAAACATTA TTTGACTAAA TTTGTAGCAA TGCTAATAAC TGCTGCTATG 7080 

GTGTGTAGCT TTGGGTTACT GAAAAGTCAG GCAGCAGAAC AACAAAGTAT TAGTGATGTA 7140 

TATAGTGTGA TAACGGATGC GAAATCTGCA CTTTCTAATA ATTCGATATC GAATGACAAT 7200 

50 AAGCAGAAAG CAATTGAGCA AGTGGTAAGT GCAGTTAAGA AATTATCGCT TGAAGATAAT 7260 

AGTGAAAGTA ATGCTGTCAA ATCAGATGTG AGAAAGCTTG AAGATGCAAA AGCGAATGAT 7320 
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GCTAGTAAAG ATGCGGGTTC TAAAATTAAA CTATTGCAAC AGCAAGTCGA TGCTAAAGAT 744 0 

GCTGCGATGA CAAAAGCGAT TAAAGATAAA AATAAAGCGG AATTAGAATC TTTGAACAAT 7500 

5 AGTTTGAATC AGATTTGGAC AAGTAATGAA ACAGTGATTC GCAATTATGA CGCAAATCAA 7560 

TATGGACAAA TTGAAGTCGC ATTATTACAA CTTAGAATTG CAATTCATAA GTCACCATTA 7620 

GATACGGCAA AAGTGTCACA TGCTTGGACA ACTTTTAAAT CAAATATTGA TCATGTCGAT 7680 

10 AAAAAAAGTA ATACGTCTGC AAATGATCAA TACCATGTAT CACAATTAAA TGATGCGTTA 7740 

GAGAAGGCGA TTAAAGCTAT CGACGACAAT CAATTGTCGG ATGCTGcaTg TGCGCTTACA 7800 

CATTTTATAG AAACTTGGCC GTATGTTGAA GGTCAAATTC AAACTAAAGA CGGTGCTTTG 7860 

15 

TATACGAAAA TTGAAGATAA AATACCATAT TATCAAAGTG TATTAGACGA ACATAATAAA 7920 

GCACATGTGA AAGATGGTTT AGTAGATTTA AATAACCAAA TTAAAGAGGT TGTTGGCCAT 7980 

AGTTATAGCT TCGTCGATGT GATGATTATC TTTTTACGTG AAGGGCTAGA AGTGTTGTTA 8040 

20 

ATTGTAATGA CATTGACTAC CATGACGCGT AATGTAAAAG ATAAGAAAGG GACTGCAAGT 8100 

GTGATTGGTG GTGCAATTGC CGGACTTGTA CTGAGTATTA TCTTAGCAAT TACGTTTGTA 8160 

25 GAAACTTTAG GGAATAGTGG CATTCTTCGT GAAAGTATGG AAGCGGGATT AGGTATCGTT 8220 

GCGGTCATAT TAATGTTTAT CGTTGGTGTT TGGATGCACA AACGTTCAAA TGCAAAACGT 8280 

TGGAATGACA TGATTAAAAA TATGTATGCT AATGCGATTA GTAATGGTAA TTTGGTATTG 8340 

30 TTAGCGACGA TTGGTTTAAT ATCTGTGTTG CGTGAAGGTG TCGAGGTTAT CATTTTCTAT 8400 

ATGGGGATGA TAGGTGAGCT AGCGACCAAA GATTTTATTA TTGGTATTGC TTTAGCTATC 8460 

GTTATTTTAA TCATCTTTGC ATTATTATTT AGATTTATAG TTAAATTAAT ACCTATTTTC 8520 

35 

TATATATTTA GAGTGTTGTC GATCTTTATT TTTATTATGG GATTCAAAAT GCTTGGCGTA 8580 

AGTATTCAAA AGTTACAATT ATTAGGTGCG ATGCCAAGAC ATGTTATTGA AGGATTCCCA 8640 

ACGATTAACT GGTTGGGCTT TTATCCAAGT TATGAACCAT TGATAGCACA AGGTGCTTAT 8700 

40 

ATTATGGTAG TTGCTATCTT AATCTTTAAA TTTAAAAAAT AAAAAACAGG CCGAGTGCCT 8760 

GTTTTTTTTG TTGCTATATT GGAAATATTC GGTATTGCAG TATAACGATA ATCACAGCAT 8820 

TGATTCGTAT AAGGTTAATG TGTTGGCGGT TTGCCTCGGC ATGTGAACTT AACGATGAAC 8880 

45 

ATACTGAACT CAAAGAGCAA TATGAGTGGC AATGTGAGTA ATATATTTAA TGTTAAATCG 894 o' 

GGTGGTGCAA TGATACTTGC TAATACAAAG CAAGCGAAAT AAATATATTT ACGrTAATGT 9000 

50 TTCAATGATG TGGTATCTAT AAGACCGAAT TTTGCAAGAC CCATAAATAA TATTGGTAAT 9060 

TGAAATAGAA GACCAAATGT GAATAACCAA CGTATGAGTT CAATCAAATA TGCTTTAAAG 9120 
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GGAAAGCCAA CATAAAATGC AAAAGCGACG CCAGCACAGA ATAATAACAC GCTGAAAAAA 924 0 

CTATATTTAT AAATAAATTG ACGTTCATTA TTATGTAATC CAGGTGCAAT GAATGCCCAC 9300 

5 AATTGATAAA 9310 



(2) INFORMATION FOR SEQ ID NO: 317: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3458 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND ED NESS : double 

(D) TOPOLOGY: linear 



15 

<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 317: 



20 



25 



40 



45 



50 



ATTAGTATTA 


CACACTAATG 


TAAATAGATT 


GGTTGGAGAA 


GAGATATTTG 


CTAATAAGTG 


60 


CCTTGCTAAT 


AATGATGTTC 


AAATTATGAA 


TTCAATAAAA 


AAATTAATTG 


AAGCTGAGTT 


120 


ATTAACAACG 


ACTAATGATT 


TTGAAGTTAG 


TATATATAAA 


AAGACAAGAC 


CTGAATTACA 


180 


AAGTATTTTA 


AAAAGTTTTG 


GTATAAAAAC 


AACAGGTAAT 


AAACCTGACT 


TAATTAAACG 


240 


I A r IXj ACGAC 


AATTTT CAT A 


TTATTAATAA 


CTTAGATTTA 


CCATATGTAT 


ATATACCAAT 


300 




GAAGAAATTT 


TAAAGAAAAC 


AGAGTACTTA 


ACCTCTTTTA 


TACAAAGTTA 


360 


TGGTGAAATT 


TCTCTTGAGC 


GTGCTTATTA 


TTTGGTTGAA 


AACTATATAG 


ATGAAAATTG 


420 


CGATGATAAA 


GTTGCAGAAA 


TATACAAGTT 


TGAATTTCAA 


AGAAAATATG 


ACAATGGCGA 


480 


GTTTGATTTT 


AATCATGGAT 


ATAATTTCGA 


ATTGAATATG 


TTGATAGATC 


ACTATAAAAG 


540 


AGATGTAAAA 


GACTACGATA 


ATGCCAGAAA 


GTATTCAAAT 


ATTTATCTTT 


ACTTTGGTTT 


600 


GAGAGATTTC 


TTAAAAAAAT 


TAATGAGTAA 


TTATTCATAT 


TACGATAgTA AAGGGAATAT 


660 


AGATTTGAAC 


GAAATACAAA 


ACGATCTGAA 


TAGATTTATC 


AACTCTAGCG 


CTTCTGGTAT 


720 


GTACGAGCGA 


TTAATATATA 


ATGAAAATTT 


ATCCAATAAT 


ATTATGTTTG 


AATTATTTAA 


780 


AAAGGACACA 


CAAGATTATA 


GTGATTTGGA 


AGAACAATTG 


ATTGAAAAGT 


TCATAAACTA 


840 


TGTAGTGTCT 


AATGTAAAAA 


AAGAAAGTAG 


GAGTAATACT 


CTTATAGAGT 


TATCAAAAAT 


900 


TTTAGAGAAC 


GGATATACAA 


TTGATAAAGA 


AGAATTTAAA 


AAAGAAGATG 


ATTATCTTTC 


960 


TAAGTACATA 


TTTACTGACA 


TAGATTATTT 


GAAAAAGTTA 


GAATCAAAAA TAAACGTTGC 


1020 


TATTGATATT 


CGAAGTGGAG 


AAATTCATTT 


GGTATTAGAT 


GATGATAGCC 


TTGATATATT 


1080 


AATACAAAAT 


CAAAAATACG 


GCAATGAGTT 


TTGAGTCATA 


ACTAAATATA ATATGTTGAA 


1140 


GAGAGGTTTT 


ATTTAAATGG 


CTAAAATTGG 


TTATGATCGT 


GTATCAACGA AAGATTAATA 


1200 
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AACGTACAGA 


GCTTGTTAAG 


TGTTTAGATT ATTTACGAGA 


GAGCGACACA 


TTAGTTGTCT 


1320 




ATCAACTTGA 


TCGGTTAGGT 


AGAACGACAA 


AACTATTaAT 


TGAATTaTCA 


CAATGATTCG 


1380 


c 
o 


ATGATAACGG 


AATTGACTTA 


CAAATTAGTA 


ACATGAACAT 


TTCAACGAAA 


GACACAATGG 


1440 




GCAAAATGTT 


TTTTACGATG 


ATGAGTGCAT 


TTTTCaGGAT 


TAGAAGTTAA 


TTTACTATGT 


1500 


10 


GAGTGTATAA 


AATAGACTTA 


GCAGCAACAA 


GAGCGAGAGG 


CCGAAAAAGC 


GGGCGCCCCT 


1560 


CTTTACCAGA 


GAATAAAAAA 


TGAGAAATTA 


AATTTTTATA 


TGATGAACAA 


ACGATAACAG 


1620 




GGGAAGAAAT 


AGCTAGTTAG 


ACAAGGGTAT GTCACTCAAC 


TGTTTATCGA 


GTTGATTAAG 


1680 


15 


AAATGAAAAA 


ACTTATACTA 


TGAATTACTG 


TTTAAAAGTG 


TGCATGTTAT 


AATATTTATT 


1740 




GAGCAAGTTG 


GATAGATGGT 


GGCTAATCTC 


TTAATAAAGG 


GGTGATGCCT 


ATGGTTATAG 


1800 




TTGTTACTCC 


TAGnAAAGGA 


CTAGCATGTC 


TGATTTTGAA 


ATGCTTATGG 


TTGTATTAAC 


1860 


20 


AATCATTGGT 


TTAGTATTGA 


TTAGTACTCA 


AGACCATAAA 


AAATAaCCTT 


CTATTCGCTT 


1920 




TGACCGGCAT 


TTTTGAAGGC 


TATTTTTAAA 


TAAAATATAA 


GGTCACCGTC 


TTTTTAACGG 


1980 




GCTCATTAGG 


GTAACATGTT 


TCCGAGTGTT 


GCCCTTTTTG 


TGTTTCAAGA 


GTTAATGATT 


2040 


25 


TTCATCTTTT 


GCTTCTACTT 


GCTACAAATA 


TATTTTAACA 


CATTTTTCTT 


ATGAATTGTA 


2100 




GTTCTGAACA 


TAATCAGAAT 


TAATAAAACC 


AACTTTCCAT 


ACAGCAGAAA 


ATACAATTAA 


2160 




AAGTATAGAA 


TGTAATCACG 


AATTATATAA 


AAAGTATTGG 


AGACCTCTTC 


ATATATAGAT 


2220 


30 


AATTCACTTA 


GTTATTTTAG 


AAAGAAGCCC 


CTAaCAACTA 


AAGTTGAAAA 


ATAGAGGAAC 


2280 




ACAGTTgGAT 


TACGCATCAA 


CTGCATaAGg CCCCTAAmAA 


CTAAAGTTGT 


AAGGGGCyCT 


2340 


35 


AAAATTTATT 


TTGGTTGATT 


GTCTTCTGGT 


TTATCTGAAG 


TCATTGTTTT 


TGTTGTATTA 


2400 


TCATTTAATG 


AATCTTGTGC 


TTTTTCTGTT 


TTTGTTTCAA 


CAGATGTTGT 


CACTTTATCA 


2460 




TTTTCTACTT 


TTGTATTTTT 


TGGTTCAGTG 


ACAACTTTTT 


TATTCTTGTC 


AGCTGTTTTT 


2520 


40 


ACTTTATCTT 


TAGTAATTTT 


TTGACCACGT 


TTTAAGTAAT 


ATTGAACGAT 


ACCCATTAAA 


2560 




ATGATTGCAT 


GAATAACAAC 


GAATAAAATA 


ATTGTCATTA 


CTGTATAAAC 


TCTTATGATA 


2640 




TTTTCTGCAA 


CACTTTGAGA 


GAGTGATTGC 


GTATTAAATG 


AAATCAAGTA 


ACCAACAGGT 


2700 


45 


GTTTTAAATA 


AAATAATAAT 


TAAGTTTAAT 


AATAGTATTC 


CAATGAAAAA 


TTTGAAAAAT 


2760 




GTTTTTTGAC 


CATTTTTCAT 


TGCTTTAAAT 


CCATTAGCTA 


AGTGTGTTTT 


TACTTTATCG 


2820 




TTAGTTGATT 


CaACGAAACT 


AGTCaTAAAG 


TTGAAAATAG 


GTATTAACAA 


TAACCAAGTA 


2880 


50 


ATAATTGCTT 


TAATCAATAA 


AACAACAATG 


ATTATGATGC 


TTTGAGTTGT 


AATAGCAATA 


2940 




CCAATCAGGT 


GTGTACTATC 


TGCATATGAT 


GATTGTACTG 


AATTCATAAT 


CATTTCTGAT 


3000 
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ATAGATACAA GACCGATCAG AACGCTCTTT AAATAATTAC CTTTTTTAAA TGCAATAAAT 3120 
AAATCGGTAA ATTTTACTTT TTCATGACTC ATTGCTCGTT TCATAACATT TGTAATTCCG 3180 
5 ATAAAAATTT GAACTAAAAC AAACAGTGAA ACTACAGCTG CTATAAGTAA TACAGCGATA 3240 

ACTTTTAAAT ATGCATCTAC TGGTGGTTTT TGCCCAAATT GTGAATAAAT TGCAATAGTT 3300 
. TGTGCATACT TAGCAAGCTG GAAATTAGCA AGTAAATATA CAACTGCAAT TACAGCAAAT 3360 

10 

GCTATAAGTG CATATATCAA TGTTATTAAT AATTGTGGTT TAGCATTTTT AAATGCTGAT 3420 
TTAAAGTAAG TAAACAAAGT GGTGCCTCCT TTTCTTCA 3458 
(2) INFORMATION FOR SEQ ID NO: 318: 

15 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 695 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
20 (D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 318: 



30 



45 



GCTTGCAAGA 


TGCTTTCATT 


AAAGACAAAG 


TCATCGATAT 


TATGAATATG 


TTCCAAAATC 


60 


ACACTGATAT 


CACTTATACG 


TTGAATAAGT 


CTCATGCACA 


TATTATATGT 


ACGCCAGAaA 


120 


TATTTGCTAA 


ATTGTTACAT 


ACGATTGCAA 


CTAGAAATAT 


CGACATTCTA 


TCTGCCAATT 


1B0 


ATAGATCGTC 


ATCTATGAGC 


AAAGCTCGTA 


TATCATAATA 


AAAGACACAT 


CTATACGATG 


240 


ATCATTTACA 


ATGATTGCGT 


ATAGTGATGT 


GTCTTTTTTT 


GTATTATTTA 


TCTTCGGAcG 


300 


ATTGATCCTC 


AACCATTTGT 


TCAAATGCTT 


CACGAACTTG 


TGGTACTGTC 


ATACCTACTA 


360 


CAACTTGGAT 


ACTCTTACCA 


CTCTTTACTA 


ATCCGTGTGC 


CATTTGTTGA TGCGTGAAAT 


420 


ATTCCGTATC 


TGCAACTTTA 


CTTTCATCAT 


AAACAGTTAA 


GCGTAATCTT 


GTTGTACAGT 


480 


TAGTAACATC 


TTTGATATTT 


TCTTTGCCGC 


CTAAACCGTC 


GAGGTAATAT 


GCAGCTTTGT 


540 


CTTCGTATTC 


ATTACCAGAT 


GAAGCACGTT 


TAGAATCTAC 


GCTATCACCT 


TTTTTATTTT 


600 


TGTAATCTTG 


CTTAGAAAAT 


AATTTAACTT 


CCTCTTCTGT 


TTyCTTACGT CCAGGTAATG 


660 


GAATATCAAA 


TTyCAAAATT 


AAGAATCTGA 


ATAAG 






695 



{2) INFORMATION FOR SEQ ID NO: 319: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 875 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



55 
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<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 319: 



5 



AATATTGaTa 


TTATATATAG 


TCGAATCaAT 


GATGACCCaC 


ATCGACCtAA 


TGCAAATAAT 


60 


AAGACAATCA 


AGCAGTTAAA 


TGACTTGTAT 


TGCTCGCGGA 


ATTTAAGATA 


TAATGAAATC 


120 


GCATTCAAGA 


AATTTGATAG 


TCATTTGCTA 


TCAATTTCAG 


AAATATATTA 


TGAATTGCTA 


180 


AATTTAATAA 


AAGCGAGTGA 


TCAGTATTAG 


AGAGAATAGA 


GCGTTAAGAC 


TCTATCGCCG 


240 


AAGtGCAAGT 


AATTTATTAC 


GAAACTCTCA 


GGcAAAAGGr 


TAATACTGTA ACGCGTTCCT 


300 


GAATTGGTGA 


TTTATAAACA 


GGGTAGCGAT 


TGCTATCCTG 


TTTTTATAAT 


TTTAAGGOGG 


360 


TATTTCAATG 


TCAAGTGATT 


TAAAACAAAC 


AC CTTT AT AT 


CAAAATTATG 


TTGATAGAGG 


420 


TGCAAAAATT 


GTGGAATTCG 


GAGGATGGGC 


GATGCCTGTT 


CAATTTTCAA GTATTAAAGA 


480 


GGAGCATAAT 


GCTGTTCGAT 


ACGAAATTGG 


CCTGTTTGAT 


GTTAGTCATA 


TGGGTGAAAT 


540 


TGAAGTAACA 


GGTAAAGATG 


CTAGTCAGTT 


TGTGCAATAT 


TTATTATCAA 


ATGATACTGA 


600 


TAATTTAACT 


ACTTCAAAAG 


CATTATATAC 


TGCTTTATGT 


AATGAAGAAG 


GCGGTATTAT 


660 


TGATGATTTA 


GTAATATATA 


AATTAGCTGA 


CGACAATTAT 


TTATTAGTTG 


TTAATGCTGC 


720 


TAATACTGAA 


AAAGATTTTA 


ATTGGATTTT 


AAAACACAAA 


GAGAAATTTG 


ATGTTGAAGT 


780 


ACAAAATGTA 


TCAAACCAAT 


ATGGTCAATT 


AGCAATACAA 


GGACCAAAAG 


CtAGAGATTT 


840 


AATTAATCAA 


TTAGTTGATG 


AAGAkGTAAC 


TGAAA 






875 



(2) INFORMATION FOR SEQ ID NO: 320: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5897 base pairs 

(B) TYPE: nucleic acid 
35 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 320: 

40 



TCTTTTTACG 


AAGGCTACCG TTTAGGATCT 


GATAACTTAA 


CTGTAGGAGA 


AATTGTATTT 


60 


AATACAGCGA 


TGACAGGTTA TCAAGAAACT 


ATTTCAGATC 


CATCATATAC 


AGGTCAGATC 


120 


ATTACTTTTA 


CGTATCCATT AATCGGTAAT 


TATGGTATCA 


ATAGAGACGA 


TTTTGAATCA 


180 


TTAGTACCTA 


CATTAAACGG TATTGTAGTG 


AAAGAAGCGA 


GTGCGCATCC 


AAGTAATTTT 


240 


AGACAGCAAA AGACACTTCA TGACGTTTTA 


GAATTGCATC 


AAATTCCAGG 


GATTGCAGGT 


300 


GTTGATACAA 


GAAGTATTAC GCGTAAAATT 


CGACAACACG 


GTGTGTTAAA AGCTGGTTTT 


360 


ACTGATCGAA 


AAGAAGATAT TGATCAACTT 


GTCAAACATT 


TACAACAAGT 


AGAATTACCT 


420 



55 



1178 



EP 0 786 519 A2 



AGTGTCGTAC TTGTAGACTT TGGTAAGAAG CAAAATATTG TTCGAGAATT AAACGTCAGA 540 

GGTTGTAACG TCACAGTTGT ACCATATACA ACTACTGCCG AAGAAATTTT AGCAATGGCT 600 

5 CCAGATGGCG TTATGCTATC AAACGGACCA GGTAATCCTG AAGTTGTAGA ATGTGCGATT 660 

CCAATGATTC AAGGAATTTT AGGGAAAATT CCGTTCTTTG GTATCTGTCT AGGACATCAA 720 

CTTTTTGCAT TATCTCAAGG AGCAAGCTCA TTTAAAATGA AGTTTGGTCA TCGTGGTGCG 780 

10 

AACCATCCAG TTAAAAATTT AGAGACTGGA AAAGTTGATA TTACGAGTCA AAACCATGGA 840 

TATGCAATAG ATATAGATTC GTTAAAAAGT ACTGATTTAG AAGTTACTCA TCTTGCATTA 900 

1S AATGATGGTA CTGTAGAAGG TTTAAAACAT AAAACATTAC CAGCATTTTC TGTTCAATAC 960 

CATCCTGAAG CAAATCCAGG ACCGTCAGAT TCAAACTATC TATTTGATGA TTTTGTAGCA 1020 

ATGATGACTA ATTTTAAGGA AAAGGAGCGT CATATCAATG CCTAAACGTA ATGATATCAA 1080 

20 AACAATTTTA GTAATAGGGT CTGGGCCAAT TATCATAGGT CAAGCAGCTG AATTTGATTA 1140 

TGCTGGAACA CAAGCATGTC TAGCTTTAAA AGAAGAGGGA TATCGAGTTA TTCTTGTAAA 1200 

TTCAAATCCA GCGACAATCA TGACTGATAA GGAAATTGCG GATAAAGTAT ATATCGAACC 1260 

25 GTTAACTCAT GATTTTATAG CGCGAATTAT ACGTAAAGAG CAACCTGACG CTTTACTTCC 1320 

AACTTTAGGT GGTCAAACAG GTTTAAACAT GGCGATTCAA CTACACGAAA GTGGTGTGCT 1380 

TCAAGATAAT AACGTCCAAT TATTAGGAAC TGAGCTAACA TCAATTCAAC AAGCAGAAGA 1440 

30 

CCGTGAAATG TTTAGAACAT TAATGAATGA TTTAAACGTT CCTGTACCAG AGAGTGACAT 1500 

TGTAAATACA GTAGAGCAAG CCTTTAAATT CAAAGAGCAA GTGGGATACC CGCTAATTGT 1560 

TAGACCGGCA TTTACGATGG GTGGTACCGG AGgCGGTATT TGTCATAATG ATGAAGAATT 1620 

35 

ACATGAAATC GTCTCAAATG GTCTTCATTA TAGTCCAGCA ACGCAATGTT TATTAGAAAA 1680 

ATCTATCGCA GGTTTTAAAG AAATCGAATA CGAgTAATgC GTGaTAAAAA CGATAATGCC 1740 

ATCGTTGTAT GTAACATGGA AAATATTGAT CCAGTTGGTA TTCATACAGG CGATTCAATT 1800 

40 

GTTGTGGCTC CTAGTCAAAC ATTATCAGAT GTTGAGTATC AAATGTTACG TGATGTTTCA 1860 

TTAAAAGTTA TTCGAGCTTT AGGTATCGAA GGTGGTTGTA ATGTTCAATT AGCATTAGAT 1920 

45 CCCCATTCAT TCGATTATTA TATTATAGAA GTAAATCCGC GTGTATCACG TTCATCAGCG 1980 

TTAgCTTCAA AAGCAACAGG ATATCCTATT GCAAAATTAG CTGCTAAAAT CGCGGTTGGT 2040 

CTAACATTAG ATGAAATGTT AAATCCAATT ACAGGAACAT CTTATGCAGC GTTTGAACCA 2100 

50 ACTTTAGACT ATGTGATTTC AAAAATACCA AGATTTCCTT TTGATAAATT TGAAAAAGGA 2160 

GAACGAGAGC TTGGCACACA AATGAAAGCA ACAGGTGAAG TTATGGCCAT TGGTCGAACT 2220 
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10 



15 



TTACCAAATG GTGAAAGCTT CGATCTTGAT TATATTAAAG AACGTATTTC ACACCAAGAT 2340 

GATGAACGAT TATTTTTCAT CGGCGAACAA TTAGAAGAGG CACAACATTA GAAGAAATTC 2400 

ATAATATGAC TCAGATTGAT TACTTCTTCT TACACAAGTT CCAAAACATT ATTGATATTG 2460 

AGCATCAATT AAAAGAGCAT CAAGGTGATT TAGAATATCT TAAATATGCA AAAGATTATG 2520 

GATTTAGTGA TAAAACAATA GCGCATCGCT TTAATATGAC GGAAGAAGAA GTATATCAAT 2580 

TGCGTATGGA AAATGATATT AAACCTGTTT ACAAGATGGT TGATACTTGC GCAgCTGAAT 2640 

TTGAATCTTC AACACCATAT TATTATGGTA CATACGAAAC TGAAAATGAA TCCATAGTTA 2700 

CTGACAAAGA AAAAATCTTA GTATTAGGCT CTGGACCAAT TCGAATCGGC CAAGGTGTAG 2760 

AATTTGACTA TGCGACAGTT CACGCCGTTT GGGCAATTCA AAAAGCAGGG TACGAAGCGA 2820 

TAATTGTGAA TAACAATCCA GAAACAGTTT CAACAGACTT CTCAATTTCT GACAAATTAT 2880 

20 ACTTTGAACC TTTAACTGAA GAAGATGTGA TGAATATCAT TAATTTAGAA AAACCTAAAG 2940 

GTGTCGTTGT ACAATTTGGA GGACAAACAG CGATTAATTT AGCAGACAAA TTGGCTAAAC 3000 

ATGGTGTTAA AATACTTGGT ACTTCACTAG AAAATCTAAA TCGTGCTGAA GATAGAAAAG 3060 

25 AATTTGAAGC ACTATTAAGA AAAATTAACG TGCCACAGCC ACAAGGGAAA ACAGCTACAT 3120 

CACCTGAGGA AGCATTAGCG AATGCTGCAG AAATCGGATA TCCGGTTGTA GTAAGACCTT 3X80 

CTTATGTATT AGGTGGTCGC GCAATGGAAA TTGTAGACAA TGACAAAGAG TTAGAAAACT 3240 

ATATGACCCA GGCTGTAAAA GCGAGTCCGG AACATCCGGT ACTAGTCGAT AGATATTTAA 3300 

CTGGTAAAGA AATTGAAGTT GATGCGATTT GTGATGGAGA AACGGTCATT ATTCCAGGAA 3360 

TCATGGAACA TATTGAACGT GCTGGTGTGC ATAGTGGTGA CTCAATCGCT GTATATCCAC 3420 

CACAAACTTT GACAGAAGAC GAGTTAGCAA CACTTGAGGA CTATACTATA AAATTAGCTA 34 80 

AAGGTTTAAA CATCATTGGC TTAATCAACA TTCAATTCGT TATAGCTCAC GATGGTGTGT 3540 

ATGTTTTAGA AGTAAATCCA CGTTCTAGTA GAACGGTACC ATTCTTAAGT AAAATTACTG 3600 

ATATTCCAAT GGCACAATTA GCTATGCGAG CAATCATTGG GGAAAAACTA ACAGATATGG 3660 

GTTATCAAGA AGGGGTTCAA CCATATGCTG AGGGTGTCTT TGTGAAAGCA CCAGTATTTA 3720 

45 GTTTTAATAA ATTGAAAAAT GTTGATATTA CTTTAGGACC TGAAATGAAG TCAACAGGTG 3780 

AAGTGATGGG GAAAGATACT ACATTAGAAA AGGCGTTATT CAAAGGGTTA ACAGGTAGTG 3840 

GCGTTGAAGT TAAAGATCAC GGTACAGTAT TAATGACCGT CAGTGACAAA GATAAAGAGG 3900 

AAGTTGTTAA ATTGGCACAA CGCTTAAATG AAGTTGGCTA TAAAATTTTA GCAACGTCTG 3 960 

GAAcAGCTAA TAAATTAGCT GAGTATGACA TACCTGCAGA AGTAGTAGGC AAAATTGGTG 4020 
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TGACTAAAGG TAAAGAAGTA GAAAGGGATG GCTTCCAAAT TAGACGTACT ACAGTTGAAA 414 0 

ATGGTATTCC ATGTTTGACA TCTTTAGATA CAGCTAATGC CTTAACGAAT GTAATTGAAA 4200 

5 

GTATGACATT TACAATGCGT CAAATGTAAA TCAATCAAAC TGTATCGGTG GGGCTGTAAT 4260 

TAACCATTTA CTTAAAGAAG TTTATATTAC AGCCTCATTA TTTTAATGAA TTTCTTAATA 4320 

TAAAGGGAGA CaTATATGAT GAAAGATTTA CCAATTATTG CATTAGATTT TGAATCAAAA 4380 

10 

GAAAAAGTAA ATCAATTTTT AGATTTATTT GATGAATCAT TATTCGTAAA AGTAGGTATG 4440 

GAACTTTTTT ATCAAGAAGG TCCTCAATTA ATTAATGAGA TAAAAGAAAG AGGCCATGAT 4500 

15 GTATTTTTAG ATTTAAAACT GCATGATATT CCTAATACAG TTGGTAAGGC GATGGAAGGA 4 560 

CTAGCTAAAT TGAATGTTGA TCTGGTAAAT GTTCATGCTG CTGGTGGCGT AAAAATGATG 4620 

TCTGAGGCCA TTAAAGGATT AAGAAAACAT AATCAAGATA CAAAAATTAT TGCAGTAACA 4680 

20 CAGCTTACGT CAACAACAGA AGACATGTTA CGACACGAAC AAAATATACA AACATCGATT 4 740 

GAAGAGGCCG TTTTAAATTA TGCCAAGTTA GCAAATGCAG CTGGTTTAGA TGGCGTTGTT 4800 

TGTTCACCTC TTGAAAGTCG TATGTTGACT GAAAAGTTAG GTACATCATT TTTAAAAGTA 4860 

25 ACACCAGGTA TTAGACCTAA AGGTGCATCT CAAAATGACC AACACCGTAT TACGACACCG 4920 

GAAGAAGCAA GACAGCTTGG TTCGACGCAT ATTGTAGTCG GTAGACCGAT TACACAAAGT 4980 

GACAATCCAG TCGAAAGTTA TCATAAAATT AAAGAAAGTT GGTTAGTATA ATGGCTAAAG 5040 

30 

AAATTGCAAA ATCATTATTA GATATTGAAG CTGTAACATT ATCACCAAAT GATTTATATA 5100 

CATGGAGTTC AGGTATTAAA TCACCGATTT ACTGTGATAA CCGTGTTACG TTAGGTTATC 5160 

CTTTAGTTCG AGGCGCAATC CGCGATGGTT TAATTAACTT AATTAAAGAA CACTTTCCTG 5220 

35 

AAGTAGAAGT TATTTCTGGT ACTGCAACAG CTGnTATTCC ACATGCAGCT TTTATTGCTG 5280 

AAAAATTAAA ATTACCAATG AATTATGTTC GTTCATCAAA TAAGAGTCAT GGTAAGCAAA 5340 

ATCAAATCGA AGGTGCTAAA AGTGAAGGTA AAAAAGTAGT TGTGATAGAA GATTTAATTT 5400 

40 

CGACAGGGGG ATCTTCAGTC ACAGCAGTTG AAGCCTTAAA ACTAGCAGGT GCAGAAGTAT 5460 

TAGGTGTTGT AGCTATCTTT ACTTACGGTT TGAAAAAAGC AGATGATACA TTTAGCAATA 5520 

45 TTCAACTACC TTTTTACACT TTAAGTGATT ACAATGAATT AATTGAAGTA GCTGAmAmTG 5580 

AAGGTAAAAT TTCTAGTGAA GATATCCAAA CATTAGTTGA ATGGAGAGAC AACTTAGCAT 5640 

AATATAGACA CTAGAAGGAG GAATTCAACA AATGAATGAC AAAACATCTA ATGATTTATA 5700 

50 TGGGAAGATA AAACATTGTA ACGAATTTAT CAATCATTCA AATGATTCCA ATCTATCTAG 5760 

TAGTCACGAT GTCGACGAAA GTTCAACGAA GCAAAAACAT ATAAAAAATA AAACAACTAT 5820 
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TTAAAAACAA AAAAGCT 

(2) INFORMATION FOR SEQ ID NO: 321: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 7965 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

Cxi) SEQUENCE DESCRIPTION: SEQ ID NO: 321: 
TCATTCTAAA TCAACTTATT TTCCATTGCA TAAATTGCTG CTTGTGTACG ATCGCTAACT 
TGTAATTTAC TAAATATATG ACTGACATGT GTTTTAATTG TTTTTTCAGA TACAAATAAA 
GTTTCTGCAA TCTCTTTATT TGTTTTACCT TTAACCATTT CACGTAACAC TTCAATTTCT 
CTCTTTGACA ACTTATTCGT GTAGTGTGGT TTTTGGCTAA CTGTTTCGAA TACATCTTGT 
GCCTTAGGAT GTATCATTTT TTCACCGTTC ATAACTCGTC TAATAGTTTC AATTAATTGC 
TGAGGCTCAA CGTCTTTCAT TTCATAACCA TCAGCACCTT TATTGATTGC TGAAATTACA 
TGTTCATCAT CAACATAACT TGTTAATACC AAAACTTTAA TATCCGGATA ATGTGCCTTA 
ATATATTCCG TAATTTCAAT ACCATTCATG CCAGGCATCA CTAAATCTAA TAGCACAATA 
TCAGGGTGCT CATGCTCTTT TAAATATTCT AAAAATGTTT CTCCATCTGC AAAGTCTTGT 
AAAACTTCTA . TGTTTTCAaT CGTGGaTAAT AAAAATCGCA ATCCTTGtCG CACAATATAA 
kGGwCATCTA CTAATATnAC TTTGTTCATG GGTTATCTCC TTAAAtCAAG CTATTTTATA 
GGAATTGTGA ATTGTATTTG TGTACCCTTT GTTGGCTGAG AATGAAAGGT CACTTTACCT 
CTTAATAATT TAACTCTTTG TTTTATGTTA TTAATACCGT GTGATGAAGC TATCTGAACA 
TTATCGATCT CAAATCCTTG ACCATAATCA ATCACGTCAA TATATAGTAT ATCGTTCATT 
TGTTTTAATG TAAGATCCAT TTTATTCGTA TCAGCATGTT TCTTAACATT ATTAATACAC 
TCTTGTAATG CTCTGTATAT GTTTTCTTCG ATTTCATTAG ATAAATCGAT TAAACCTTCT 
ACATTTACAT TTAATTGTAT ATGCATTAAT TTACTATATG CTGTCAAAGC ATGAATTAAA 
CCTTGCTCAA GTCCAACTGG CTTAAGTnGC CAAATCAATG CACGCATTTC ATTAACGGCA 
TTTTGACTCG TTtCCTCAAT CGTCTTGAAT GCTTGTTTAG CGATGGATTC GTTTGACATG 
CCATACGCAG CATGTGCtGT TAGTTTTACA GAAAATAACA TTTGATTTAC TGAATCATGT 
AAATCTCTAG CTAAACGATT ACGTTCATTA ATTTTTGCCG CTTCTTTTTC ACGGTCTGTT 
AAATAAATAC GTTTGATGGC TGACCCTAAT TGAAATGCGA CAGACTCTAG CAACTCTAAA 
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TGACCCGATT TAAGTGGTAC CGTTGCATGA TGTGTAATAT TGTCATTTTG GCTAGGAAAT 1440 

GCTTTAGAGG CTAAGTTAAT ACGAGAACAA TTGACGATAT TCGACGCTTT CATTAGCCTA 1500 

5 

CGTTGATTAA ATGCTTTCAC ACACCAACAA GACCCATCTT TAATATAGTG ACAGTGGTCT 1560 

GCTGTCAAAG ATTGTGGTAG AGCCACATGT GATACAAGTT CATGTTCACC TACGCTATTG 1620 

ATGAAAAATA TCCAGCCTGT CGTGAAATTA CTGCCCTCAA TTAAATATTT TAACGCACCT 1680 

10 

TGGGTCATGC TATACATTTC rGTTTCTTCG TTTAAAAATT CGGCAATCTC TTTTAATAAA 1740 

GCTAGTCGCG TCCTTTGTTC CATCAAATCG CTCCAATTCA TTTTTACGTG TATTAACTAT 1800 

TATACATTGA GTTATTATAT TTTTAAATCT TAGACGTAAA CATGATAAAA TGGCCTTGAT 1860 

TACTCAATAG TTATATTTCG GAGAACTGAT TTGTGATATG ATATTAAAGA CTATAGGAGG 1920 

ATTTTATGAA ATTTAAAATA CCAGAAAACT TTAATGACTT AAGTTTACGA GATATTTTCC 1980 

20 AACAACTTAA GGTACCTAAA AAAGATTTAC ATCATTTAAA TATGTCTAAA GATATTACTA 2040 

TTAATGATAA ACCTGCGCGA TTAATGGATA AAGTGCATAC TGGCGACGAT GTATTTGTTC 2100 

CAACCATCGA TGAAAAAAGT AATTATGTTC CAAGTTATCG TTATGCACAA ATTAAATACG 2160 

25 AAGACGATGA TATGGCAATC GTAATGAAAC CTAAAGGTGT TAAGACTCAC CCTAATGATT 2220 

TAAAAGAAAG CAATACTTTA ATGAATCATG TGATTTACAC TATTGATAGT GACTATGTCG 2280 

AACCAATTCA TCGACTGGAC CAGGAAACAG TAGGATTATT AATTGTTGCT AAAAATCCTT 2340 

30 

TAATGAAAAA AATTCTTGAT CGCATGTTAG AAGACAATGA TATTACGCGG ATATACAAAG 2400 

CAAATGTTAA GGCACTTTTA CCTTTAAAAC CACAAACGAT TGATATGCCA ATTGGTAAAG 2460 

ATAAATTCCA TTCGAATAAA CGACGTGTGT CTCCTACTGG ACAGCGTGCA ATTACACACA 2520 

35 

TTTTAACTTC AAAAATGATA AAAGAAGCTG TGTGCCmACT TGAAATCAAG TTGGATACTG 2580 

GACGTACTCA TCAAATwCGT GTGCATTTAG CTGAAATTGG TCACCCTGTT ATTGGTGATC 2640 

4Q CTTTATATGG TGATTCAACG TTAAGACAAT TAGAACTTGA AAGTTACAAA ATAGAGTTTG 2700 

TGcATCCCTT GACTAAGGAA GTCATTTCCG TTTCTTTGGA TGACTAATTT GATTAGTTTT 2760 

GCATGATATT tAAACATGCA ATACCGCATT GTAACTAAAT CAAGTATCAA CtTAAAcGGA 2820 

45 TAGATGGAAA ATTATTAATT TTTTCAGATG TTCGGTTTTT TTGTTTTTTA CGATGCTTAG 2880 

GATTTTATAT TTTGATATTT TAGTAATTAT TCATTTTATA ACATCCTTGG ATAATGACTT 2940 

GTAGTCTTTT TCAACTGCGT TACGTGTATC TATGGACAAT ACATGACATC ATAAGATTTT 3000 

50 TATCACAGGT TGTTTGGCCA ATACATGTAC AACAATTCAT CATATAAAAA ATAGGTTCTA 3060 

TAATAAAACG GACTCCATGA AAAGTTTTTC CTTTTCATGG CTCTATATCA AATCAGACTT 3120 
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CCAAACTTTA 


TTTTATATTA ATATTTAATT AATGAGGATC TACCATATCT TCTGGTTTAA 


3240 


£ 


TCCATGCTTC 


AAATTGTTCT 


TCTGTAACAT ATCCAGTTTG AATTGCAGAT TCTTTTAAAG 


3300 




TTAAACCTTC 


TTTATGGGCT 


TTCTTAGCAA TTTGAGCTGC TTTTTCATAA CCAATATGTG ' 


3360 




GATTTAATGC 


AGTAACTAAC 


ATTAATGATT GATTTAAATA ATTATCAATA TTCTCTTCGA 


3420 


10 


TTGGTTCAAT 


GCCCACTGCA 


CAATTGTTAT TAAATGTTTC CATACCATCA GCTAAAAGAT 


3480 




AAATTGATTG 


TAGTGTATTA 


TGCATAATAA CTGGTTTATA AACATTCAAT TCAAAGTTAC 


3540 




CTTGTGAACT 


TGCGAACCAA CAACTGTATC ATTACCCATT ACTTGGACTG CnACCATTGT 


3600 


15 


TAACATTTCA 


CATTGTGTAG 


GATTAACTTT ACCAGGCATA ATTGATGAAC CTGGTTCATT 


3660 




TTCAGGGATA 


GAAATTTCTG 


CCAAACCAGC TCGTGGCCCT GAAGCCAACC ATCTCACATC 


3720 




ATTAGCAATT 


TTCATTAAGT 


CTCCTGCTAA TGCCTTCAAT GTTCCATGCA ATTGAACAAC 


3780 


20 


TTCATCATGC 


GCTGTAAGTG 


CGTGGAATTT ATTTTCAGAA GATACAAATG GATAACCCGT 


3840 




ATTTTCTGAA 


ATATAATGTG 


CCACTTTATC ACCAAATTCA GGATGCGCAT TAATACCAGT 


3900 




ACCAACAGCC 


GTACCACCGA 


TGGCAAGATT TAAAATGTGC TTCTTAGATT CAGATAACAT 


3960 


25 


TGTTTCACAA 


CGGTCAAGCA 


TATAACGCCA GCCACTAATC TCTTGTCCTA GTTTGATCGG 


4020 




CGTTGCATCT 


TGTAAATGTG 


TACGACCAAT TTTAATAATT GAATCAAATT TATCTTCTkT 


4060 


30 


TTCTTTCAAA 


GTATTTCTTA 


AAAGTTTTAA TGCAGGTTCT AATTTTGTTT CAACCTCTTG 


4140 


ATATAATGCA 


ACGTGCATAG 


CAGTTGGGaA TGTATCaTTC GaACTTTGAG ATTyATTTAC 


4200 




ATCATCATTk 


GGGTGGATAC 


TTTCATCACT TTGATGATCT TTTAAATACA TATTAGCAAC 


4260 


35 


ATAACTTACT 


ACTTCGTTCA 


CATTCATATT ACTTTGTGTA CCGCTTCCTG TTTGCCATAC 


4320 




AACTAGTGGG 


AAGTGTTCAT 


CTAATTCACC TGATAAAATT TGATCACATG CGTATACAAT 


4380 




GGCATCTTTC 


TTTGCCTCGC 


TTAATTTTCC TAAATCAAAA TTAGCTATTG CTGCTGCACG 


4440 


40 


CTTTAGTTGT 


GCAAAACCAT 


AAACTACTTC GATTGGCATA CGCTCTTTAC CAACTGGGAA 


4500 




ATTACGTTTA 


CTTCTTTCTG 


TTTGAGCACC CCAATATTTA TCTGCAGGTA CTTCTATTTC 


4560 




TCCAAAAGTA 


TCATGTTCAA 


TTCTTACTGA CATTCAATTT CTCCCCTTAT CACTGTTTAT 


4620 


45 


TTAACTGTAG 


TATATCATTA AATAATTTAA TTGAGCAATT TATGATTAAA ACGTTTTCAT 


4680 




AATTTGAAAT 


AAAAATACAC 


TAATCGCACG TGTTCACCCT TTATTACAGT GATACGGTCA 


4740 




TACGATTAGT 


GTGTTATCTA 


TCATTATTTA GTTATTATTG AACTAAGTTT AATTACGATA 


4800 


SO 


CTTTGTTTTA 


GTAGCTTCAA 


CCGtAGCAAT AGCTGTAAGT ATATATAATA CAGCACTAAC 


4860 




AATTGTCGTA 


TATGGATTTA GAGCAACAAG CGTaCCTAAA ACTCCTGTTA AACTCGCATA 


4920 
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TACAATACCT GATTGATTAC TTTTAATGAA TGTTTGCGCA TTAACATCAT CAATTAATCC 504 0 

TTTTGATAAA TTGAGTTGTA ATTTTATTAC TTTGAAAATA ACAGGTAAAT ATAATGCCCC 5100 

AATTGCCAAT GGAAAAGCTT TAATTGATAT TAAACTTATA ATAACTGTTG CTATCAATAA 516 0 

TTGAATCCAG TATTTTCCTA ACATAAATAT ATAAATCTCC TCTAATTTCA TTCTTCAATA 5220 

GCATATCATA ATCTTGGCAT ATTAAGAAAC GCGGTTTAAT GATTTCATTA AAAATATTAC 52 80 

TGATAGATGA CTTCTTTCAA TTATGTCTGG AGTAATTAAT TATCAATTCC GTTTAAATGG 5340 

TGTTTTAATA TTTAAAATTG AACTTTTGAT ATATTACTAT GTCTGGTACA CAAATCAATG 5400 

TTTTATGCTT TACAAAGTTA TATTGGCAGT AGTTGACTGC AGTCCACAAC ATAGAGGCTT 5460 

CGGAATGTCA GCTTCTATTT CATGCAAGTT GGTGGAGCTC CAACATAGTG GAATTGGATT 5520 

CCCAATTTCT ACAGACATTG CAAATTGGGG AAACGGGCCA CAAACTCAGA AACTGGTGGA 5580 

20 AAGTCAGCTT AAAATAACAT GCAAGTTGGC GAGGCCCCAA AATAGTGAGA TCGGATTTCT 5640 

AATTTCTACA GACATTGCAA ATTAGGGAAA CGGGCCACAA ACTCAGAAGT TGGTGGAAAG 5700 

TCAGCTTAAA ATAACATGCA AGTTGGCGGG GCCACAACAT AGAAAAATTG GATCCTCAAT 5760 

TTCTACAAAC AATGTAAGTT GGGGAAACAG CCCCAACACT GAAACTAGCA GAAAGTCAGC 5B20 

TTCTATGAAT ATAATAAAAA AGCTAGGTAA CAAAATGCTA CCTAACTTCA TATTCAAGAT 5880 

AATCAATCCT ATTTGATATA TGTTCTATAC TATACATTAT TTACATGATA AATAACTGAA 5940 

TATTACACAA TTATAATACT TTACTGACTG TCTTCTTCAG AATTCTTTTC TTGATCATTT 6000 

TGATCAGAGA TTTGTTCCaT TTCTTTACCT AATTCTTTTA AATCTTCAAA ATCCGTTACC 6060 

ATACTGTTTT CTTCTTCATG ATAATTTAAT TTTGGATCTT TGTCTTTAGA CATAATCAAT 6120 

ACCTCACAGA TTTTTAATTA AGCAAAGCGT GACGTAAAGT AAGCTTTAAC ATCTTCAGGT 6180 

AAACCTGCAG CCGCTTCTTT ATCAAGAATA ACATTTACCA TTCTATGTGC TTTTAAATCG 6240 

GCTGGTTCGA AGCTTGTTTT ACCATTTTCT TGATATAATT TTTCAACTAC ATCTCGTTTA 6300 

TTAGCACCTG TCACTACTAA GAAAATTTCT CTTGCTTCCA TTAGTCCTTG ACGAATACTA 6360 

ACATTTAACT TACCTTGCTC ATCGATAGAA ACAACTTGTA ATGTTAATTT CCCTTTATTT 6420 

45 TCTTTAGTTT TAATCTTATC AGCGATTAAT TCGATTGCAT CTTTTTCATA AGCAATTGGA 6480 

TAAACTTGAC CTGCTGGTAC ACCTAACGCT TCGAAATATG ATTTTTTATC GTCATAATCT 6540 

AAAATATTTA TTTGGCTAAA ATCAACAGCA TGTTTTTCAA CATTTTTCTT TAATTCATCT 6600 

AGAACTGGCG CTTGATCTGT ATCTAAATGA AAACCTGCAA TTGTAGTAGG ATTATTGTTA 6660 

AATTGCTTTC TAATAATATC AGCAGCATAT TCTGCTACAA GTTGACTATT GTCAAAGACT 6720 
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5 * 
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35 



GATATTAATA 


ATTATTATAC 


CCTAACTTTC 


AATATATCAA ACCATTTAAC 


TTTAACATGC 


6840 


TTATACTCTA 


AATATAGCAC 


TTAAGCATCA 


TTTTTATAAT 


GAAAATGAGT 


AAATTTTAAT 


6900 


TCAATCCCGG 


rAAATCTTGT 


TGACGTAACG 


CTTCATAAAT 


TAACAACGCA 


GCAGTATTTG 


6960 


ATAAATTTAA 


TGAACGAATA 


TGTTCACTCA 


TAGGAATTCT 


TAACGCTGTG 


TCTTGATATT 


7020 


TCTCTTTCAC 


CCAGTCTGGT 


AATCCTGTCG 


TTTCTTTTCC 


AAAAATGAAG 


TAAAAATCTT 


7080 


TGTCATGATT 


TGAAAAATCA 


AAATCACTAT 


AAGTCTTTTT 


ACCAAATTTT 


GTTAATAAGT 


7140 


AATACTCGCC 


ATTTGTGACT 


TCAAAAAATG 


CTTCAATACT 


ATCATGATAC 


GTAATATTCA 


7200 


CAAATTCCCA 


ATAATCTAAA 


CCGGCTCTTT 


TTAACATTTT ATCATCAGTT 


CTAAATCCAA . 


7260 


GAGGTTTAAT 


TAAATGTAAA 


TGTGTGTTTG 


TACCTGCACA CGTACGgCAA TGTTACCAGT 


7320 


ATTAGCTGGG 


ATTTCTGGTT 


GATATAAAAC 


GATATGATTT 


GTCATATTAC 


TATTCTCTCC 


7380 


TTGTGTCTAA 


TCCTTTTATC 


ATTTCATTCT 


GAACTTCTGC 


ATCCTCTTGA 


TCATAATTAG 


7440 


CATTGATAAA 


ATCTCTTGCT 


TCTTCCCCAA 


GAATTTGACC 


AATGGCCCAA 


TAAGCAGTTG 


7500 


CTCGAATCAA 


CGGTCTTTCA 


TCTGTTGTTG 


CAACTTTTTT 


CAATTCTGGA ATTGCATCCA 


7560 


CTTCATTAAA 


ATGCGCCAAT 


GCTAAAATAG 


CATTTCGTTG 


TATCGGCTTT 


TTACCACGCC 


7620 


AAGCACCTGC 


AAGgTGACCA 


TATGTTTGTT 


TGAATTCTTT 


ATTAGACATA 


CGTAGtAAAG 


7660 


GTACTAATCT 


TGGCTTTAAA 


ATTTCTGGTT 


C CAAAATG AT 


GTCATCTTGT • 


TCGGTATTAA 


7740 


TACCTCTATT 


TTTCGGACAA 


ACTTGTTGAC 


ACGTATCGCA 


ACCATATAAT 


CTATTCCCAA 


7800 


TTTTATAACG 


ATATTGGTCA 


GGCATATAGC 


CTTTTGTTTG 


CGTTAAAAAA 


CTAATGCATT 


7860 


TCTGACTATT 


TAATTGGCCA 


TTTCCAACTA 


ATGCACTTGT 


TGGACAACGA 


TCAACACAAA 


7920 


TTGTACAATG 


CACCACAGCT 


ATCTAATAAT 


GGATCATCAG 


GTTCC. 




7965 



(2) INFORMATION FOR SEQ ID NO: 322: 



(i) SEQUENCE CHARACTERISTICS: 
40 (A) LENGTH: 1302 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

45 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 322: 
GCCCTGTTGG AGAAATCACC TTTATACGAT GGTTGAAAAA GCATCATTAG GTACAATCGT 60 
SO GGCAATTATA GTTATTTTGC TGTTTTTAAG AAACATTCGT ACGACGGCAA TTTCTATTAT 120 
ATCGATTCCG TTATCACTTC TTATGGCGCT TATTGCTCTG AAATTGAGTG ATGTTTCATT 180 

55 
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TGTAGTTGTT GAAAATATTT ATCGACGCTT AACAGATTCA GAAGAACAAC TAAAAGGTGA 300 

AAATTTAATT ATCAGTGCGA CAACTGAAGT ATTTAAACCA ATAATGTCAT CGACACTAGT 360 

5 TACTATTATC GTCTTCTTAC CACTTGTGTT TGTATCAGGT TCAGTAGGCG AAATGTTTAG 420 

ACCTTTTGCA TTGGCTATTG CATTTAGTTT ATTAGCATCG TTATTAGTGT CAATTACACT 480 

CGTTCCAGCG TTGGCAGCTA CACTATTTAA AAAAGGCGTT AAACGTCGTA ATAAACAACA 540 

10 

TCAAGAAGGA TTAGGTGTTG TTAGTACAAC TTATAAAAAA GTATTACATT GGTCATTAAA 600 

TCATAAGTGG ATTGTAATTA TATTAAGTAC ATTAATTTTG GTTGCAACTA TTGTATTTGG 660 

AGGACCGAGA CTAGGCACTA GCTTTATTTC AGCAGGTGAC GATAAATTTT TAGCTATTAC 720 

15 

TTATACACCG AAGCCTGGTG AAACGGAGCA AGCAGTGTTG AATCATGCGA AAGATGTTGA 780 

AAAATATTTA AAACAGAAAA AGCATGTAAA AACAATTCAA TACTCAGTTG GCGGTAGTAG 840 

TCCAGTAGAT CCAACGGGTA GTACAAATAG TATGGCAATC ATGGTTGAAT ATGATAATGA 900 

20 

CACGCCTAAT TTTGATGTAG AAGCGGATAA GGTTATTAAA CATGCAGATG GCTTTAAACA 960 

TCCTGGAGAG TGGAAAAATC AAGATTTAGG AACAGGTGCA GGTAATAAAT CTGTAGAGGT 1020 

25 TACTGTAAAA GGTCCATCAA TGGATGCCAT AAAATCAACT GTAAAAGATA TTGAACAGAA 1080 

AATGAAACAG GTTAAAGGAC TAGCCAATGT CAAATCTGAT TTATCGCAAA CATATGATCA 1140 

GTATGAAATT AAAGTCGATC AAAATAAAGC GGCAGAAAAT GGTATTTCTG CAAGTCAACT 1200 

30 TGCAATGCAC TTGAATGAAA ACTTACCAGA AAAAACAGTT ACGACTGTTA AAGAAAATGG 1260 

TAAAACTGTT GATGTTAAAG TCAAACAAAA TAAGCAAACA GC 1302 
(2} INFORMATION FOR SEQ ID NO: 323: 

35 .(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1003 base pairs 

(B) TYPE: nucleic acid 
(CJ STRAND EDNESS : double 
(D) TOPOLOGY: linear 

40 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 323: 
ATATATATTA ATTTAAACGT GTTTCACATG TACCAGTGTT AATGACAGAT AATGCTGCGT 60 

45 

TTAAACCACC TTCAACAAGG TTTTGTACTG CTTCATCAGA GAAGAAAGCA ATATGTGGTG 120 
TTACTAAAAT TCTTTCATGT TCGATTAACT CTAATAATGT TTTATCGTCA ATGTCTTTAT 180 
SQ TAGTCCAGTC ATTTGTGAAG TATGCTGCTT CATTTTCATA AGTATCAATC GCAGCACCTA 240 
ACAAAGTACC ATCfcTTCACT GCAGCGATTA AATCAGGTGT ATTGATGACT GCACCACGTG 300 
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20 



25 



30 



35 



40 



50 



GATAGCTTTC TTTGTTCGCT GGAACATGTA AAGAAATAAT ATCGGCATCT TTAATAGCTT 
CTTTAACACT ATCTTTATAA GTTAAAAAGT CTAAATCTTT ATTAGGATAG GCGTCATAAG 
CTGTAATTGT AGCACCAAAT CCTGCATATA TtTTAGCTGT AGCAGCACCG ATACGACCCG 
TACCAATAAT TGCAACAGTC ATATTTTTAA CTGGTTTAGA CATGATTTCT GCTTGCCAAG 



420 
480 
540 
600 

10 TAAAATCATG TGCTTGTACA CGGCGTTCAA TATCTGGGAA GCGACGCACT AA1TGTAGGG 660 



CGATAGArAC AGAATACTCT GCAATtGTTT CAGGTGAATA ACTAGGAACG TTAGATATCA 
CAATATTGTG TTTTTTAGCT AAATCTAAAT CATACATATC AAATCCAGCA GTACGTTGTG 
15 CAATTTGTTT AATACCGTAA GATTCTAATT TAGGATAAAC GTCATTTTCT AACTTACCAA 

ATTGCATTGT AGTTACGCCA TCGTAATCTT TTAATTGAtC GACTGTAGCA CTTGATAATA 
GCTCTTTAGA AGTAGTTACT TCGACATTAT TCTtTtTCCC CCAATTTAAT GCCATCTCTT 
TCTCATAATC ACGCGTaCCA AAGAACATAA TTCTCGTCAT TAT 
(2) INFORMATION FOR SEQ ID NO: 324: 



Ci) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5030 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 324: 
GGCTTTTATA GTGTTTACGA TTATTATGAT TACTTATATT CACGCTGTTA AAAATTATCC 
AAATAACCGT ACTGTTCATT ATGGTTATAC AGCTGCATTT ATACTTGTTA TATTACAAGT 
TATCACAGGT GCATTATCTA TTATGACAAA TGTTAACCTG ATAATCGCAC TTTTCCATGC 
ATTATTTATC ACTTATTTAT TTGGTATGAC AACATACTTT ATCATGCTAA TGTTACGATC 
AGTAAGAAGT GACArGCAAT AACaAAAAAG cmAACCGTAA TTTTAATGGC ACGCCCATTA 
AAATTACGGT nTTTTATATC AATATTTAAA AtTAAACCtA AGCCATGTAA AAACGAGATT 
45 ACACGTCAAT TGTTGTGTAA TCTCGTTTTA TnTTAATCAT TTTAGTCAGT TGCTTTTTCA 

ATTTCGATTA ATAAATCGCC TGTCGCTATT GTGTCACCAT TATTTACAGT TACTTGTTTA 
ATCACACCGT CAAATGGTGC TTGAATTGTT GTTTCCATTT TCATAGCTTC AGTAATTAGC 
AACGGCTGAT TAGCTTTCAC AGTTTCACCT ACACTAACCT TGACTTCAGT TACTGAACCT 
GGCATTTGAG CACCGATATG ACTTGGATTA CTCTTATCTG CTTTTGGCTT AACGTTCGCA 
TTTGTATGCA CATTTTCATC TTTAATGTAA ATACGTCTCG CTTGACCATT CATCGCATAG 



720 
780 
840 
900 
960 
1003 
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CGTTTACCTT TATCGATTTC GATTTCTACT GTTTCACCAT TACGCATTCC AAAGAAGAAT 840 

GTAGGCGTAT CAAGTAACGA TAAGTTTCCG TATTGATTTC TAGTTTGAAT ATATTGTTCA 900 

TATACTTTTG GATATAGTAC ATAACTAATA ATATCTTGCT CCGTAACAGG ACCTTGTTGC 960 

TCTTCTTCAA GCAACTCACG GACTTTTTCA AAATCAACTG GCTCTAGATA TTCACCTGGA 1020 

CGAGCTGTTA GTGCTTCTTG GCCTTTTAAA ATAACCGCTT GTAAATCTTT ATTAAAACCA 1080 

TTTACAGGTT GTCCTATTTC ACCTTTGAAG AACGACACTA CTGATTCTGG GAAATCTAAT 1140 

TTATAGCCAT CTGTAATCAC GGATTGTTCA TCAAGATCAT TTTGTACCAT ATAAAGTGCC 1200 

ATATCACCAA CTACTTTAGA CGATGGTGTT ACTTTTACGA TATCACCAAA TAAGAAATTC 1260 

ACTCTGCGAT ACATATCTTT GACTTCATCA AATCTTTCGC CTAAACCTAA ACTTTTAGCT 1320 

TGTTGACTTA AATTCGAATA CTGTCCACCA GGCATTTCAT GTTGATAAAT TTCAGTATTC 1380 

20 GGTGATTTGA TATCACTTTc AAAGTCTGAA TAATAAGTAC GTACAGTTGA CCAATAATGA 1440 

CTAAGTGACT CCATACCTTC AATATCAGTT CTAAGGTGGC GTGGGAAGCC ATTTAATGCA 1500 

TAATATAACG AATTGGCGCT TGGCTGACTT GTTAAACCAC TCATTGAAGC AACAGCAGTA 1560 

TCAATGATAT CGACACCAGC ATCTATTGCT TGTTTGTATG TTAATAAACC ATTACCACTT 1620 

GTATCATGAG TGTGAAGATG AATTGGTAAA TCTACAGCTG ATTTTAACTC ACCAATCAAT 1680 

TCGTAAGCGG CTTTAGGTTT TAATAAGCCT GCCATATCTT TAATCGCTAA AATATGGAAA 1740 

CCTTCACGTT CTAACTCTTT AGCTAGTTTG ACATAATACT CTAAAGTATA AATGTTTGAT 1800 

CGCTCAGGAT TTAAAATGTC ACCTGTATAA CAAATAGTAC CTTCTGAGAT TTTGCCCGCT 1860 

35 TCTTGTACTG CTTCATTGGC AACTTTCATT TGATCTACCC AGTTTAATGA ATCGAAAATT 1920 

CTAAAGACAT CTATGCCTGC TTTAGCACTT TCTTGTACGA ATTTATGAAT AACATTATCA 1980 

GGATAGTTTT TATAACCAAC TGCGTTTGAA GCACGTAACA ACATTTGGAA TAATACATTT 2040 

GGAATAGCTT TACGTAGACG TTCAAGTCGT TCCCATGGGT TTTCCTTCAA GAAATTATAT 2100 

GCCACATCAA ATGTAGCACC GCCCCACATT TCTAGTGAGA AACCATCTTT AAATACGTCC 2160 

GCTGTTTTGG ATGCGATATT AATCATATCC TTAGTTCTAA CTCGTGTAGC TAATAATGAT 2220 

TGGTGTGCAT CTCTAAAGGT TGTATCTGTT AGTAAGACAT CATCCTGCTT TTTAACCCAT 2280 

TCAGCTACAC CTTTTGGACC TACTTCATCA AGCAATTGTT TCGTACCACT AAATGAAGCG 2340 

50 ATTTTACTTG AAGATACAGT TGGAATTGAT GCTAATTCAT AGTCTGGTTT CGGACGTTTC 2400 

TCAACATTTG GGAAACCATT AATTGTTACA TTACCTATAT ATTCTAATGT TTTAGTACCT 2460 

CTATCTAGAG ACGGCTGAAT GTCGAAAAGT TCTGGTGTTT CTTCAATAAA TTTAGTTGTG 2520 
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TTAACACCAC GAATACGCAT TTCTCGTAAT GAGCGTACCA TTTTTTCTTC TGCTTGTTTA 2640 

AATGATATCG CGTGTGTAGA TAATTTTACG AGTAATGAAT CATAATAAGG TGATATCTCA 2700 

GCACCTTGGA AACCATCTCC AGCATCAAGA CGTACACCAA AGCCCCCGCT TGAACGATAA 2760 

GCAATGATTG TTCCAGTATC CGGCATGAAA TCATTTAACG GATCTTCTGT TGTAATACGA 2820 

CATTGGATGG CATAGCCTAA TGTTGTAATA TCTTTTTGTT GCGGCATATT AATCTCTTCA 2880 

CCAAATAAAT CGGCACCTGC TGCAACTAAA ATTTGTGTCT TAACAATATC AATTCCTGTT 2940 

ACCATCTCTG TAATTGTATG CTCTACTTGT ACACGAGGGT TAACTTCTAT AAAGAAGAAT 3 000 

TCGTCACCAG ATACTAG AAA TTCAACAGTA CCTGCATTGA CATATTTAAT ATTTTCCATC 3060 

AATTGAATTG CAGCATCACA AATACGTTGA CGTAATGTTG ATGATAATCC AACTGATGGT 3120 

GCAACTTCTA CAACTTTTTG ATGACGACGT TGTACTGAAC AATCACGTTC AAATAAGTGT 3180 

ACGATATTTC CATGTTCGTC ACCTATGACT TGTACTTCAA TATGCTTTGG ATTATCAATG 3240 

TATCTTTCTA TGTAAACTTC ACTATTACCA AATGATTTTT CAGCTTCTGA TTTTGCTCTA 33 00 

TGGAAAGCAT CTTCTAATTC ACTTTCTTCA CGAACGATTC TCATACCTTT ACCGCCGCCA 3360 

CCACTTGTGG CTTTAATCAT TAGCGGGAAA CCAGCTTCTT CTGCAAATTC TTTTGCTAAT 34 20 

TCATATGATT TAATTGGACC GTCTGTACCA GGAATAACTG GTAAATCTGC CTTGATAGCC 3480 

GTTGTACGAG CTTTAACTTT ATCTCCAAAC ATATCTAAAT GTTCTAAATG AGGACCAATA 354 0 

AATTTAATTC CTTCTTCTGC ACAACGACGC GCAAATTGTT CATTTTCACT TAAAAATCCA 3600 

TAGCCAGGAT GAATCGCATC CACATTCGCT TGTTTTGCTA CATCAATGAT ACGCTCAATA 3660 

TTTAAATAAC TTTCAGCAGG AC CTAAATCA CTTCCAACTA AATAGGATTC ATCTGCTTTA 3720 

TATCTATGTA ATGAACTTTT GTCTTCATTC GAATAAATTG CAACTGTGCT GATGTCTAAT 3780 

TCTGCCGCCG CTCTGAATAT ACGAATTGCA ATTTCTCCAC GGTTAGCAAC AAGTAACTTT 3 840 

TTTATTTGTT TCAATAGCGA TACACTCCTC AAACTATTAG AATTTTCTAA CTAATTAGAT 3900 

AATAAAATTT TATCTTAAAG CGCTCTGTTT TGCTATAGTt mTGTTTCmAA TTTTCAAAaT 3960 

TTaACATyCT tGAGACAATT AAAaCCyCCG CTTCmGaAAT AATAATTTCA AAAATGACTA 4020 

TGCAACAACA GGTAGTTCCA CGTTTTTGTT GTGAAACATT TTCGATTTCT ACAACTCTAA 4 080 

AAAATTAAAA ATAAAATTGC AAAACATCAA CATTTATTAT CAATAGCGAT AACTTTATCT 4140 

TATCATGATG ATTCTAATTT CGCCACCACA TTTAGTAATT TTTAGTCATA AAATTTAGTT 4200 

ATAATTATAC GTTGTTTTGT TTATAAAATT TGATAATCak GAGTAATCtC GTAATATCAA 4 2 60 

AACaAAAAGG AAGTTAAGCG TTGTTTGGTT Gc CTAACTTC ' CGTTATTGAA CTCATCcAGT 432 0 
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TCTCGTACTA AATATTGGCT AGTATTTTTT TAATTAAATT GTCTTCTTAT ATCAACTTTT 444 0 

TGTTGTTGTT TCTTTCGTTG CTGGTCTACT TTGATTTGTT TACCTACAAT CAGAAGTAAA 4500 

CCCATAGCAA TACTTAAACT AATCATTGAT GATCCACCAA AGCTGATAAA TGGCAATGGC 4560 

ACACCAGTTA ATGGAATTGT TGCCGAAATA CCGCCAATGT TTACAAACGT TTGACTTCCA 4620 

AAGTATGTGG CAATCCCAAC ACACACAAGT TTATAAAAAT ATGATGATGT TTTATTTGCA 4680 

AACTGGAAGG CACGATATAC AATAAAGAAC TCTAAAGTAA TAACTAGCAA TCCTCCGATT 4740 

AAACCTAATT CTTCGCAAAT AATTGCAAAA ATAAAATCTG TATGTGGTTC TGGTAAATAG 4800 

CCCAATTTCA TTGCACTATT TCCTAATCCT TTTCCAAATA CGCCACCGTT ACCTATCGCA 4860 

AGCAATGAAT TGGAAATATG GTATCCAGTT CCTGATTCGA ATTGGAATGG ATCTGTTAGC 4920 

GTACTAAATC TGGCAGTTAA ATAACTTGGT AACCAACCAG CCATTAATGC AATGACAAAT 4980 

20 ACTACTAAGA ATCCTAGCAC TGCTGGTATA CCAAATCTTA GGACTTTGTT 5030 

(2) INFORMATION FOR SEQ ID NO: 325: 
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<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1389 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 325: 

CTTGTTAATC CGAAAATTAT TAGTCAATCA AATGAAACAA TAACAGACTT nGAAGGTTCA 60 

35 ATTACATTGC CAGATGTTTA CGGCGAAGTG ACAAGAAGTA AAATGATAGT TGTCGAAAGT 120 

TATGACGTCA ATGGGAACAA AGTTGaACTA ACTGCACATG aAGATGTAGC AAGAATGATT 180 

TTGCATATTA TAGATCAAAT GAACGGTaTC CCTTTTACAG AACGTGCGGA CCGTATTTTA 24 0 

ACAGATAAAG AAGTGGAGGC ATATTTTATA AATGACTAAA ATAATATTTA TGGGTACACC 300 

AGACTTTTCA ACAACTGTTT TAGAAATGCT TATTGCAGAA CATGATGTCA TTGCAGTCGT 360 

AACGCAACCA GATCGACCTG TTGGACGTAA ACGTGTTATG ACACCACCAC CAGTTAAAAA 420 

AGTTGCAATG AAATATGATT TACCTGTATA TCAACCTGAA AAATTAAGTG GATCAGAAGA 480 

ATTAGAACAA TTGCTTCAAT TAGATGTAGA TTTAATTGTA ACTGCTGCTT TTGGACAATT 540 

ATTACCTGAA TCATTGTTGG CATTACCAAA TCTTGGGGCA ATTAATGTAC ATGCATCATT 600 

GTTACCGAAG TATAGAGGTG GTGCACCAAT TCATCAGGCA ATTATCGATG GTGAACAAGA 660 

AACCGGCATA ACAATTATGT ATATGGTTAA AAAATTAGAT GCGGGTAATA TTATTTCGCA 720 
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ATTAGGGGCA GATTTATTAA AAGAAACTTT ACCATCTATT ATAGAGGGCA CAAATGAAAG 840 

CGTACCTCAA GATGATACGC AAGCAACATT TGCTTCCAAT ATTCGACGCG AAGATGAGCG 900 

AATTAGCTGG AATAAACCAG GAAGACAAGT GTTTAATCAA ATTCGTGGAT TATCACCATG 960 

GCCAGTTGCT TATACAACTA TGGATGACAC TAACTTGAAA ATATACGATG CTGAACTCGT 1020 

TGAGACTAAT AAGATAAACG AGCCTGGAAC CATTATAGAA ACGACTAAAA AAGCCATTAT 1080 

TGTTGCTACA AATGATAATG AAGCTGTTGC AATTAAAGAT ATGCAATTAG CTGGGAAAAA 114 0 

GAGAATGTTA GCTGCCAATT ATTTAAGTGG TGCGCAAAAC ACACTAGTAG GGAAGAAACT 1200 

TATATGATAG AAAACGTGAG AAGTCTTGCT TTTGACACGA TTCAAGATAT ATTAAATGAA 1260 

• GGTGCGTATA GTAACTTGCG TATCAATGAA GTGTTGTCAG AAAATGAATT AAATGCAATG 1320 

GATAAGGCTT TATTTACAGA AATTGTCTAC GGAACCGTTA AAAGAAAATA TACGTTAGAT 1380 

20 TTTTATTTA 1389 

(2) INFORMATION FOR SEQ ID NO: 326: 

(i) SEQUENCE CHARACTERISTICS: 
25 (A) LENGTH: 2746 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

30 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 326: 

TTTGCTAATA ACAATAAAGC CAAAGCCGAT TCACACTCTA AACAGCTAGA AATTAATGTT 60 

35 AAGAGTGACA AAGTACCTCA AAAAGTAAAA GATCTAGCAC AACAACAATT TGCTGGTTAT 120 

GCTAAAGCAT TAGATAAACA AAGTAATGCA AAAACTGGTA AATATGAACT TGGCGAaCTT 180 

TTaAAATTTA TAAATTTAAT GGTGAAGAAG ATAATAGTTA CTATTATCCA GTTATAAAAG 24 0 

ACGGTAAAAT TGTTTATACT TTAACACTTA GTCCTAAAAA TAAAGATGAT TTAAACAAAT 300 

CAAAAGAAGA CATGAATTAC AGTGTTAAAA TTTCAAACTT CATCGCTAAA GATTTAGACC 360 

AAATTAAAGA TAAAnATTCA AATATCACTG TTCTTACTGA TGrAAAAGGG kTTTATTTTG 420 

aAGAAGATGG cmAAGTTAGA TTAGTAAAAG CTACGCCTCT ACCTGGTAAT GTAAAAGAnA 480 

AAGAAAGTGC TAAAACAGTT TCAGCAAAAT TGAaACAAGA GTTaAAAAAT ACAGTAACAC 540 

50 CTACTAAAGT TGAAGAAAAC GAaGCGATrC AAGAAGATCA AGTTCAATAT GAAAATACAT 600 

TAAAAAACTT CAAAATTwGA GaACAACAAT TCGATAACTC ATGGTGTGCA GGATTCAGTA 660 

TGGCAGCATT ATTAAATGCa ACTAAAAATa CAGACACTTA TAATGCACAT GATATTATGC 720 
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AAATGATTGA ATACGGTAAA TCACAAGGCA GAGATATTCA TTATCAAGAA GGCGTACCAT 840 

CATATGAACA AGTTGATCAA CTTACAAAAG ATAATGTAGG AATTATGATC CTTGCACmAA 900 

GTGTATCTCA AAACCCTAAT GACCCACATT TAGGACATGC GCTAGCAGTT GTTGGTAATG 960 

CTAAAATTAA TGACCAAGAA AAACTTATTT ACTGGAATCC TTGGGATACA GAaTTATCAA 1020 

TCCAAGATGC AGATTCAAGC CTATTACATT TATCATTCAA TCGTGATTAT AACTGGTATG 1080 

GTTCAATGAT AGGTTACkAA AAAGTAATAT AGATATTGAT TAAAGGCAGG TAAAACTATG 1140 

TATCAACTAC AATTTATAAA TTTAGTTTAC GACACAACCA AACTCACACA TCTAGAACAA 1200 

ACCAATATCA ATTTATTCAT TGGTAATTGG AGTAATCATC AATTACAAAA ATCAATTTGT 1260 

ATACGTCATG GCGATGATAC AAGTCACAAT CAATATCATA TTCTTTTTAT AGATACGGCA 1320 

CATCAACGCA TTAAATTTTC ATCTATTGAT AATGAAGAAA TCATTTATAT TCTTGATTAT 1380 

20 GATGATACAC AGCATATCCT CATGCAAACG TCATCCAAAC AAGGTATTGG CACTTCGCGA 144 0 

CCAATCGTTT ATGAGCGCTT AGTATAACTA ATTTAAATGA TTTCACTTCA TAAAGCGGGT 1500 

TGGCGAGAAT TCAATTTCTC ACCAGCTCGT TTTTTCATTG TAATAATAAT CTTTAACATT 1560 

TATTCTTTCT CTATTAATTT TTCTCAAACT ATCTTATCTT TATGATAATT AATTAAAATG 1620 

CCCTTTTAAA TTCTTATAAA ATAAAAAAGC CACCTATCGT CGCTAATAAA CGACGCAAGT 1680 

GACTTAATAT CATATTCAAA ATAACTTATG GGAATTTAGG GAATTGATCG AAGTCAGGAT 174 0 

CACGTTTTTC TTTAAACGCA TCACGGCCTT CTTTCGCTTC ATCAGTTGTG TAATAAAGCA 1800 

ATGTTGCATC CCCAGCCATT TGTTGTAAAC CAGCTAAACC ATCTGTGTCA GCATTCATAG 1860 

35 CTGCTTTAAG GAATCGTAAC GCTGTTGGTG AGTGTTTCAT AATCTCTTTA CACCATTGCA 1920 

CAGTTTCATC TTCAACTTTC TCTAAAGGTA CCACTGTATT TACTAGACCC ATATCTAAAG 1980 

CTTCTTGTGC ATTGTATTGA CGACATAAGT ACCAAATTTC ACGTGCTTTC TTATGTCCAA 2040 

CGATACGTGC TAAATATCCT GAACCATAAC CCGCATCAAA TGAACCTACT TTAGGACCAG 2100 

TTTGTCCAAA AATAGCATTA TCAGCAGCAA TCGTTAAGTC ACAAACAACA TTTAGTACAT 2160 

TACCGCCACC TACAGCATAA CCTTTTACCA TCGCGATAAC CGGTTTTGGA ATAATACGAA 2220 

TTAAACGCTG TAAATCTAAT ACATTTAAGC GAGGGATTTG GTCTTCACCT ACATAACCAC 2280 

CATGTCCACG TTTCTTCTGG TCACCACCAG AACAGAATGC TAAATCACCT TCACCAGTTA 2340 

so ATACGATAAC TGAAACGTTT TGATCATCAC GTGCACGTGA AAATGCGTCA ATCATTTCAG 24 00 

CAACTGTTTT AGGTGTAAAC GCATTGCGTA CTTCAGGGCG ATTTATTGTT ACCTTAGCAA 2460 

TCCCTTCGTA AAATTCATAT TTGATTTCAT CATATTCTCT AAGTGTTTCC CATTGTCTGT 2520 
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TCCACATGAA TTGTATGACC TGTAGCAGAA ATTAATTTAC ATTTACTATT AGGAATTAAA 264 0 

TTTGCCATTT TTTTCGCAAT CTGTACAAAT TTTTCATCAT ATTCTCCAGC TAATATTAAT 2700 

5 GTTGGTACTT TAATTTCTnT CAGCGCGGCC ATAAGTTTGG CATTTG 2746 

(2) INFORMATION FOR SEQ ID NO: 327: 

(i) SEQUENCE CHARACTERISTICS: 
10 (A) LENGTH: 900 base pairs 

(B) TYPE: nucleic acid 
CO STRANDEDNESS : double 
(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 327: 



20 



25 



30 





1 1 1A1 lAAui 


GTAAGTTCGT 


ATATCAATGT 


TTAGTGCTCC 


CCAAAATTGA 


60 


AGTTTGAATT 


TTAAAAGCAT. 


CTTGTAGAAT 


TTAGTTGTAT 


TTTTTTCAAA 


GAAATTCATT 


120 


TTGATTATTT 


TTGATAATGA 


GCATTTTAAT 


AGTAATACAT 


GTTTATAGTG 


TGTAGTATAT 


180 


GTCTATACTA 


GTAGTAACTA 


TATAGAGAAA 


GTAGGAATAA 


ACTATGTCAC 


AAGATGTAAA 


240 


TGAATTAAGT 


AAGCAACCAA 


CGCCAGATAA 


AGCAGAAGAT 


AACGCATTTT 


TCCCATCACC 


300 


ATATTCCCTT 


AGTCAATATA 


CAGCACCTAA 


AACAGATTTT 


GATGGTGTTG 


AACACAAAGG 


360 


TGCCTATAAA 


GATGGTAAAT 


GGAAAGTATT 


GATGATTGCT 


GCTGAAGAGC 


GATATGTATT 


420 


ATTGGAAAAT 


GGAAAAATGT 


TCTCTACGGG 


TAATCATCCT 


GTTGAAATGT 


TATTACCTTT 


480 


ACATCATTTA 


ATGGAAGCAG 


GTTTTGACGT 


TGATGTTGCG 


ACATTATCTG 


GTTATCCAGT 


540 


TAAATTAGAA 


TTATGGGCTA 


TGCCAACTGA 


AGACGAGGCA 


GTTATAAGTA 


CTTATAATAA 


600 


ATTGAAAGAA 


AAATTAAAAC 


AGCCAAAAAA 


ATTAGCAGAT 


GTGATTAAAA ATGAATTAGG 


660 


ACCTGATTCA 


GACTATTTAT 


CTGTCTTTAT 


CCCAGGCGGA 


CATGCTGCAG 


TTGTTGGTAT 


720 


TTCTGAAAGT 


GAGGACGTTC 


AACAAACATT 


AGATTGGGCA 


TTAGACAATG 


ACCGCTTTAT 


780 


AGTTACATTA 


TGTCATGGAC 


CAGCAGCACT 


ACTTTCAGCA 


GGGCTTAACA 


GAGAAAAATC 


840 


TCCATTAGAA 


GGATACTCTG 


TTTGTGTCTt 


CCCTGaCTCA 


TTAGATGAAG 


GTGCAAATAT 


900 



(2) INFORMATION FOR SEQ ID NO: 328: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 364 2 base pairs 
so (B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
<D) TOPOLOGY: linear 
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ATCTGAnTnG AGATAGTGAT AATGTGTCAC CcAATTTTaA AcCtTTATTT TTaAGcGtTT 60 

CaTCaGCTAA CaCtTCaTTa TCtTTAGtCG cTTTATGcCC tTCtATTAAA CtCGGaACtA 120 

AAAATGaTGa CtTTTCAACa CCGAACaCTA AAACaTTGtC tTTTTGATGG CCaTTAGACA 180 

CAATTTCCCC TGTTTGCTTC AAAGTAGCTT GCTTCTTGTA TTTATTTTCA ATATCTTTCT 24 0 

TGTTAAAAAC AGATTGTTGC ACAGTTTGAT TGGCATCTTT ATTTAGAACA ATGGCATCTG 300 

CTTGCCACTT ATCAATGCCT TCTTTATTCA TATTGATAAG ACCATTCGCC AATCCAGATA 360 

ATAAAAATAG CAAGTAACTA ATCATCGTTA ACACACCAAT AATTAGTCCA AACTTCAATT 420 

TGTTGCGCCG TATTTCATTC CAAGCTAAAA ACATGCATTT CTCTCCCTAC TACTATGATT 4 80 

TAAACATTGT TTATATTCTT AGATGCACGT ACGTCGTGTT GCGCTCTGTA ATGTTATACA 540 

TACACTTATC CTTCATTATA CCCGAACTTT TTATATTAAA AGCAAATTTA TGGAAAATGC 600 

20 AATTAATTGT CTATTATTTT TGTACGGTAC ATTTAAAATT AAGGATCAAT TTAAAAACGC 660 

CTACATATAG CTTTAAGTAC ATGTAGACGT CCAATTCATA TATTATTTAA CTTCGCCTGT 720 

TTTAGGATCG AATTGCTTAA TAGCATTTTT ACGTAATTTA TCTTTTGCTT TrTCACTTGC 780 

TTTATAGTTA TTGTTGTAAA TCGTAGCTTC CCAACTACCA TACATTGGGT TAGGGAAAAT 840 

GATATATTTC TTACCGAAAT CGTCTTTATG TTTTTCAATT AATGCTTCAC GAGATTCAGC 900 

TGTAGCTTCT TTTGGATCTG TAAAGTCTAA TAAATTATCT CCAAATAGCA TGACAAGTTT 960 

ATGATCCTTT TGAACCATTT GTCTGCGTGA TTCTTTACTC TTATCATCTT TACCTTTTAG 1020 

TAAAATATGA CTCTTCTTAG CTTGAGGGAT ACCTTGTTGT TTTAAGTTCT TTTGTGTTGC 1080 

35 CTTTAAATCT TTTTCTTTAT CTCTATCAGA AATATAGTAG ATATCGACAC CTTTTTTGTC 1140 

AGCATATTTC AAGAATTCTT TTGCGCCATA GACAGGTTTA GCTTTAGCAG CTTGTACCCA 1200 

TTCATGCCAA CCTTCTGGGA AAGGTTTATT ATGTATTGAT GCATAGCCTT GATATGGAGA 1260 

ATTATCTAAA ACTGTTTCAT CTAAATCCAA AGCAATAGCT AACTTATGTT TACCTTTATT 1320 

CTTTTTAATC TCTTTATCTA ACTGTGTCTT TGCACTGTTA TAACCTTGTA AATATAATGC 1380 

TTTTGCTTCA GCTGAATTTT GATACCAAGC CACTGCCATA ATATTTTGAT TACCAAGATT 1440 

CGCCTTTTGT GATGCTGGTA TAGAAGCTTG TTGCGTTTGT TGAACTTCAG CAGAACTTTT 1500 

GGCAAACGCT GTAGAATTTG TCGTTTGTGG TGCTGAAACT GTAACCGCTA CCGATAATGA 1560 

50 TGCTATTGCA ATATACTTTG AAATTTTATT CATCTTATCA CCTCATGATT AATATTTAAA 1620 

ATACAGTTAA AATTATAAAT GCATTTATTT AATATTGCTA TACTATGAAA AGATATTTAA 1680 

TATTATTTCT TGgAAAAGCT AACAAATATG TGAACATTTC ATATAAGCAT GATTTAATGG 1740 
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GTGACTAGGC CTTCCTATCA GACATATTCA 
GCTATCTCTT ATTTACCTAT TGGAACAACC 
5 ATAGCAGTCC TCACTCATAC AATTTCTCAT 

CTTACTTTCA CCTATTTTAA TTCATAAAAA 
GCAAGACGTT ATTATTGCAA TCTTTTTTAT 

10 

AAGATAAAGT AAGAACGTTT TTATTTTTCA 
TTAGGAAGGA AATTACATTG AAAAAACAAG 

1S TATTTTTTGG AGCCGGAAAT TTAATATTCC 
ATATGTGGAT TGGTATGCTA GGCTTTGCCC 
TTATTGTTGT TGCATTTTAT GATGAAGGTG 

20 GGTTCGGGTT TATTTTTGCT. GTCGTGATTT 
CACGTGCTGC AAATGTCGCG TACGAAATTG 
AATGGACTTT AATTATATTC GCAGCAATCT 

25 

ATCCATCGAA AATCGTTGAT AATTTAGGTA 
TCGCTCTATT AAGTATTGCT GTCATTTTCA 
ATAAATATAT AACACATCCT TTCATTTCAG 

30 

TTGTTGCTGC GTTAGCTTTT TCCGTAGTCA 
CAGATCGCAT GAAAATTTTA AAATATGTCT 
35 TTGGAATGAT TTACTTTGCA CTTGCATACG 

AAGATGGTAC AGATATATTG ACGTACAACT 
TCGTATTTGG AATGACGGTT ATCCTTGCAT 

40 

tTGCGCCACA TTTACTAAGA AACACGTACC 
TTTCtCTATC ATAGGGTTCT TATTTACAAC 
TGTCCCATTA TTGACTTTAA TATATCCCGT 

45 

TAACATGTTT AGCACATTCA GATTCAGTTG 
GATTATTTCA ATTTTACAAA TACTAAATAG 
50 ATCGTTTATG ATGTTACCTT TAGCAGATAT 
CTTTGCTATT ATCGGTTTCA TAATCGATGT 
TTAATAAATG CTCACTGCCT AGTAATGATT 

55 
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CTCATCCACG TATCATTATG TGTACAGTGT I860 

ATAAACTCAT CCATAGTTTA CCTTTTATAA 1920 

AAAAATCACA ACGCTCCAAC GTATTTCCAA 1980 

CGACACTTTA ATTGTCATTA TCCAATAATA 2040 

AAAATAATAG AATCATAGTA TTGTCATTTA 2100 

GATTTTTTAA ATTATTATGA ATATCTAGTT 2160 

TTATTATTTC GGGCCTCATG TTATTTTCAC 2220 

CGCCCATGCT TGGCCATACA GCGGGTCAAA 2280 

TTACAGGCAT ATnACTCCCC TTTATTACTG 2340 

TTGAAAGTGT AGGCAATCGT ATACATCCAT 2400 

ACATGTCTAT CGGAGCATTT TACGGTATTC 2460 

GTACAAGACA CATTTTACCT GTGCATAACC 2520 

TTTTTGCCAT CGTTTACTGG ATTAGTTTAA 2580 

AATTATTAAC ACCGTTATTA CTATTAATGG 2640 

ACCCTGAATC TGCACTAAGT GCACCTAAGG 2700 

GAAGTTTGGA AGGGTATTTT ACAATGGATC 2760 

TTGTCAATGG CTATAAGTTT AAAGGCCTCA 2820 

GCTTTTCAGG TCTTATTGCA GCCATATTAC 2880 

TTGGGGCATC AACAGCTCCA GGAAACTTTA 2940 

CATTACGATT ATTTGGTTCG TTCGGTAACC 3000 

GCCTAACAAC ATGTATAGGA CTCGTcAATG 3060 

TAAGTTTTCT TATAAAATAT TCGCACTTAT 3120 

ACTTGGTTTA GAAATGATTT TAAAAATTGC 3180 

GTCGATTGCA CTTGTACTCA TATCATTTGC 3240 

GGCCTATCGA CTCGCAACTG TTATTACATT 3300 

TTTCAACTTA TTACACGGTG TTATTTTGAA 3360 

CGATTTAGCT TGGCTTGTAC CATTCATGCT. 3420 

ATTTATACGC CGTCCGAAAC AAGCGACAAC 34 80 

GACCCATCGT TACTAgGCTT TTt t ATATGA 354 0 
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TAAAAAATCC TAGCTGTTAT TCAAAAATAT TAGTTTTTAA AA 3642 
(2) INFORMATION FOR SEQ ID NO: 329: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2187 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 329: 

TTATTGATAT TGAAAATTCA AAAACTGCAA CACATCTTAT CACTAAAAAC CAACACTATC 60 

ATCAAACTGA CACTCATTTT GAACAGTATA AGAAATTTAT TTTAGATTCA GGTATATCAT 120 

CAACACAATT TGTATATAAT AACCTGTCTG TAAGCGGATT TAAATATACT AATGATGGTA 180 

AGAATCCAAT TCAATTATCT GACATAGTGT ATCACTTAAT CGCATTATTA CGATATGGCG 240 

GTGGCATTAG CTATCAATTA TTAGATGACC ATTCAAATTA TATTTCCTTG TACAACAAAT 300 

ATGGTAGCCC CCTACCATTA ATGCATTTAT ATAAAATGTT TAGACCTTTT GTTAATGAAG 3 60 

ATATTGAAAT TACAAATAAT TATGTATTGA GTCGTAAAGA TAATAACTAC CATTTCTTAT 420 

TATTCAATAA AATTAATGAT CGATATATGT CAGACGTAAA ACAAGATTTC ATTTTCCATA 4 80 

ATGAATTACC TCAAGACTCT TTGATGATTA TTAAAACATT GAATCATGAA CATGGTTCAA 54 0 

TTCAACATTT GCTTCCAATA AGCGATCAAC TTGTTTATAT AGAAAAAGAA ATTTTAGATG 600 

AATTAGACAA AACGAATTAC CCTAAAACGG AGCTTGCAGT TCAAGAAGAA ACTGGTCGTA 660 

35 CATTTGAACT CAAGTTAAAT CACGACGAGG TTAAATATAT TTGCTTTAAA CCAAGCTAAA 720 

TACTAACAGT CCTCTTGTGT TTAGTTTCTT ACGTTAAAGG CTATTTATAT CATAAGGAGA 780 

TGATTTGTAA TGAGTAACTC ACAAGCAATT CAAGCAATTG AAAACGTGTT AGTAACGTCA 840 

AAAGTTGGTG TATTATCAAC TGCATATAAT AATAAnCCTA ATAGTAGATA TATGGTCTTT 900 

TATAATGATG GTCTTACTTT ATATACTAAA ACGAATATCC ATTCTGCTAA GGTCAAAGAA 960 

ATTAAAGATA ATCCAGCAGC ATATGTTTTG TTAGGCTATA ACGACACAAC TAATCGTAGT 1020 

TTCGTTGAGA TGGAAGCGAC AATCGAAATC GTTACAGAAC AAGAAGTGAT TGATTGGCTA 1080 

TGGGAAACAC AAGACAAAAG CTTTTTCAGT TCAAAAGAAG ACCCAGAGTT ATGTGTTTTA 1140 

50 AGAGTAGTTC CGCAATCCAT TAAGCTAATG AATGATAAAT CATTAGATAC ACCTATCAAA 1200 

ATCGATTTAT AACACAAAGT GTATATAGGA AATAACTTTT ATGAATTCTA GATATAACAA 1260 

TGTTAAATAC TTAAAATAAC TCGCTATAAT TAAAGTGTTT AATATGTTTA CAATTCAATT 1320 
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TTTTATGTAA 


TATAAATACT 


GCATTTGCAA 


ACTGTTGCAC 


TTTTAGGTAT 


1440 


iv iv p a zv & 1*1* a 


ACTACATTTA 


AGGAGATTGA 


TGAACCATGA AAAAGAAAAA AGGTTTTGGT 


1500 


\* k luulni in 


\i i J I AATCGC 


CATCATGTTA 


ATTGTATGTA 


TTGTATTAGT AATCATGATG 


1560 




bAAAGAAAGA 


TACATACTAT 


GGAATTATGA 


AAGATAATAC 


TACTATTGAA 


1620 




/"■TV TV IV IV A A f* IV 

vjTGAAAAAGA 


TGAAAGTATT 


GAAAAAAATG 


TTAAATTACC 


TTCAGATTCA 


1680 


UAJAjJ. XAAAJb 


TTAAAAAAGG 


TGATTTTGTA 


ATTGTTTATA AATTAGCAGA 


TTCAGATAAA 


1740 


ATTGTTAAAG 


I f if n «t it it it n it 

TTAAAAAAGT 


TGACCATGAC 


GATGTACCAC ATGGTTTAAT 


GATGAAAATT 


1800 


CATGACATGG 


GCAAAATGCA 


CATGAAACAC 


TAATTGTAAT 


TTAAATTACA 


AATTTTAGTT 


1860 


GCCATCAAGG 


TATATACGAG 


TAAAAGCAGC 


GGTAAGTTGA 


TTTCCAATTT 


GGAATCATTT 


1920 


TACTGCTGCT 


TTTTATATTT 


GAAATACTTT 


CATATTGAAT 


AGCTCCACTT 


GCCGTTCGCC 


1980 


TgcgCTTTGC 


GCATGCATAA 


AAGCCCCTAA 


CAACCTGAGG 


TCACTGCGCT 


CCGGTTCGCC 


2040 


TGcgCTTTAG 


CGCATGCATA 


AAAGCCCCTA 


ACAACCTGAG 


GTCACTACGC 


TTCGGTTCGC 


2100 


CTGCGCTTTA 


GCGCATGCAT 


AAAAGTCCCT 


AACAACCTGA 


GGTCACTACG 


CTTCCGTTCG 


2160 


CCTG.CGCTTT 


AnCATGGCCA 


TAAAAGC 








2187 



(2) INFORMATION FOR SEQ ID NO: 330: 

(i) SEQUENCE CHARACTERISTICS: 
30 (A) LENGTH: 1788 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

35 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 330: 

CCnCCTTTTT AAACCTGGnG AAATGtmCAG tTTTGATGGt ATTGGGtTCT TTAGTATTAT 60 

40 

GCTTAAGATA GAGTGTAATA CGCTCCTGTT GTTCTTTATA GTATATTGCT TTTTGTTTTT 120 

CTTTTTCGTC ATATTTCACT TTTAAATAAA TGACTGATGC AACTATACAT ATACATAAAA 180 

TGACACCAAT AATTATAAAA ACATGTTTTT TGTTCATTAA AGTAACTCCT AAAATGTGGT 240 

45 

GGAAAATGAA AAAATTTTTA TAATCTATAA TTATGAACAT TACAGATTAT AAACCATAAC 300 

ACTAACATCG TCGCCTTCAT TAACTTGATT GTTAAAATCA GCAATTACTG AGAATTGTAC 360 

50 AAGGAATAAT TGCCTATTAT GCCCTCATGT AATTATTGCC TTACTAACAT TAACAAAATC 420 

GATAGCTATT ACATTAAATG CCTATACCCC AGACCTCAAA CACCTTTTTA TACAGGACGC 480 

ACTGTAATTT CATyyACGTT AACGTGCTTT GGTTGTGTTA ATGCATATAA TACTGCTTCT 540 
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AATGCTTGTT 


ACTTTAACGC 


CTGTCTTTGC 


CAACTCTTTT 


660 


TP T A ATPPTT 


^ A PT TV & T a P T 


G 1 GAAL. X vjL i 


GCTTTCGTCG 


CACTATAAAT 


CGT ACT A CTT 


720 




ft acrr ap a 


a ft t ft p ft Tr* ft 
AAi AGA1GCA 


ft mf ft ft T ft ft 

ATGTTAATAA 


GATGGC CACT 


TGATTGTTCT 


780 


A A C AT AR TTO 


/IT a a TP P a pp 


L. 1 G IbLLij I A 


•"P ft ""P ft ft ft /""TV/'"' 

I A 1 AAAGTGC 


CTTTGATATT 


t\ /i 7\ mo ft ft TV* 

CACATCAATC 


840 




APTPaTPTaP 
At. lUi L. 1 At, 


1 1GA1AATGA 


GTAATCTTAG 


ACGACAACAT 


m<TV"' o 00 l\ 

TTGCCCCGCA 


900 




pft iTRTrrs ft 


At. CAC CG AAT 


GTTTGTTGTG 


CAATTTTTAT 


CAATT CAT CG 


960 


AL. ilt-ilL.lI 


TATTCGTTAC 


ATCTGTTGGC 


ACTA C C TTCA 


CACTATCTTG 


TGACAATTGA 


1020 


TTCG CTACGT 


TTTGTAATTT 


TTCTTTATTT 


CTACCTG CTA 


AGACAACTTT 


TGCCCCTTCT 


1080 


m/i* m^"T>ft OT*ft 

TCATGTAGTA 


ATGTTGCAAT 


TGCTTCTCCA 


ATACCACTAC 


CTGCACCTGT 


AACTACTGCT 


1140 


ACTTTATCTG 


TTAATAC TGT 


CATAATGATC 


GACTCCTTTG 


ATTCTTTTTA 


TTTTTTCAGG 


1200 


GTAAATCATA 


AATACATATT 


ACTTTTAAAA 


AGCGTATCAC 


AATTCATATA 


ACGGTCATAA 


1260 


TAACTCGCTT 


CATTTTCATA 


GATAAATTAC 


ATTACAAGCC 


ATTCGAAACA 


TACAATTAAT 


1320 


CGTTGCTTAT 


ATTTTT T ATT 


TTTAAAAATG 


TTGAAAAATC 


GTCACTTCTT 


TATTGTAAAA 


1380 


ACATTATATT 


AGTAATAAAG 


TT AAT AC TG T 


GnATTTaTCA 


TTCGATTGAA 


TGATTAGAGG 


1440 


GAGGAATAAA 


ACgTGACATA 


TCATGAGCGT 


GTTTTAGCAT 


TAAGAGCAGA 


AAGTAAAAGA 


1500 


ACCGCATTTG 


ATTTTCGATT 


CGAAGATTTA 


TTTAGCAAAG 


AAGAATGGcT 


AAGTATGTCT 


1560 


CTTGCAGAAA 


GACAAAAAGC 


TGAAAAAGCA 


TTTCGACACG 


AgTTAAAAAT ATGGACGATG 


1620 


TAAGAATGCC 


CTTCTCAAGT 


GTCCATGACG 


CCCAAGTAAA 


ATTATATAAT 


GTTGTATATT 


1680 


CTTATAACGG 


CaTTAAACGT 


AATTTTAAAC 


AAGTTGAAAA 


TGGAAGGATT 


CTAATATCAT 


1740 


TTCGTTTATA 


TATnGCAGAC 


CATGGATAGA 


ATTTTnTATG 


GTnAATCC 




1788 



(2) INFORMATION FOR SEQ ID NO: 331: 

40 

<i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 1341 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

45 

ixi) SEQUENCE DESCRIPTION: SEQ ID NO: 331: 
50 TAAGCCAAAT CCATTGTTAC CAGAAGAAGT TCGCTTCATC TTAAAACAAA TGGGTCTTAA 60 

AGAAAAGACT ATCGATGTTG AACTCGAAGT TGGCGAGCAA GTTCGTATTA AATCAGGTCC 120 
ATTTGCGAAT CAAGTTGGTG AAGTTCAAGA AATTGAAACA GaTAAGTTTA AGCTAACAGT 180 
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GCTTTAATTA ACAATTAAAG TTATTAAACT AACCAAAAGA TAAAAAAGAG TATTGATTTT 300 

TTAATTAGAA AAGTGTTAAA ATTATGTGGT cGcGCTTTTA GAGCGCCCAT TTCGTcACGA 360 

AATGTTAAGA GTGGGAGGGC AAAACTGAGC CCTGTGACCA CATCACGATA TCAAGGAGGT 420 

GCACATCGTG GCTAAAAAAG TAGATAAAGT TGTTAAATTA CAAATTCCTG CAGGTAAAGC 480 

GAATCCAGCA CCACCAGTTG GTCCAGCATT AGGTCAAGCA GGTGTGAACA TCATGGGATT 540 

CTGTAAAGAG TTCAATGCAC GTACTCAAGA TCAAGCAGGT TTAATTATTC CGGTAGAAAT 600 

CAGTGTTTAT GAAGATCGTT CATTTACATT TATTACaAAA ACTCCACCGG CTCCaGTATT 660 

JS ACTTAAAAAA GCAGCTGGTA TTGAAAAAGG TTCAGGCGAA CCAAACAAAA CTAAAGTTGC 720 

TACAGTAACT AAAGATCAAG TACGCGAAAT TGCTAACAGC AAAATGCAAG ACTTAAACGC 780 

TGCTGACGAA GAAGCAGCTA TGCGTATTAT CGAAGGTACT GCACGTAGTA TGGGTATCGT 840 

TGTAGAATAA TTTTACGAAT ATTAAATTTG ATTACATGAT TTAAACGATG AAGCAGATAA 900 

CAGAGATAAT AATGATGAAT TATAAATATA ATCTGAATGA CTAGATTAAT GATTGATTTA 960 

TTCATAAGAT TAATTCTTGT GTTGTCJGCy CTTAACTTGC ATATAGCAAG TAATGTGGGA 1020 

GGAAATTCCG CTAAAACCAC TAAAGGAGGA ACTATAAATG GCTAAAAAAG GTAAAAAGTA 1080 

TCAAGAAGCA GCTAGTAAAG TTGACCGTAC TCAGCACTAC AGTGTTGAAG AAGCAATTAA 1140 

ATT AG CT AAA GAAACAAGCA TTGCTAACTT TGACGCTTCT GTTGAAGTTG CATTCCGTTT 1200 

AGGAATTGAT ACACGTAAAA ATGACCAACA AATCCGTGGT GCAGTTGTAT TACCAAACGG 1260 

AACTGGTAAA TCACAAAGTG TATTAGTATT CGCTAAAGGT GACAAAATTG CTGAAGCTGA 1320 

35 AGCAGCAGGT GCTGACTATG T 1341 

(2) INFORMATION FOR SEQ ID NO: 332: 

(i) SEQUENCE CHARACTERISTICS: 
40 (A) LENGTH: 5136 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

45 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 332: 

CTCTAAATCT TCAATAGGTA ACTTCATTTT AATAATTCCC ATTTGAACAA TTGCTTCTTC 60 

50 ATCATTGACA ATTTCTAAAA CTTCACCCTT TTGACCGTAA GAkAATACTT TkACTTCATC 120 

ACCAGCAACA ATTTTATCGT ATTTTTGCTT TTGTACATTT TGCTTTATAG ATTTCGCTTC 180 

ATAATGATCA TCTAATCGTT TCTTCTTATC AATCAATTCA TGTTCTTTAA CATCTGCACC 240 
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CTTAATCTTC TGATTTGCTT TkTCTTTCGC TTCCTCTATT AGAGACTTTT CATAATTTTG 360 

GAATTGTTGA TACTGCTTAG ATAAATCATC ATGCACTTGt CCGCkTskTT TACAAGACGG 420 

TCCAGkTCTA ACCTCTGTGT CTCTACACGT TTGTAATTAC GCTCTAATGA TTCAATCATT 4 80 

TCATTTATTT CTTTTTCATC AGTACCAATC ATCGTCTTAG CCTTATTAAT AATATTCAAA 54 0 

CTAAGACCTA ACTTTTTAGA AATGTCAAAA GCATTTGAAC GACCCGGCAC ACCCATTAAT 600 

AACTTATACG TTGGACTCAA AGTATCTACA TCAAATTCTA CACTCGCATT CATAACGCCT 660 

TCTCGATTAT AACTATATGC TTTAAGTTCA GGATAGTGCG TCGTTGCCAT TACTAGAGAA 720 

CCAATTTTTC TAACATGATC TAAAATGCTC ATTGCTAATG CAGCACCTTC ACTCGGATCT 7 BO 

GTACCTGCAC CTAATTCATC AAATAAAACT AAACTATGTT TGTCTGCATG CTTTAAAATT 84 0 

TCAACTATAT TCGTCATATG AGATGAAAAA GTTGATAATG ATTGTTCTAT TGATTGTTCA 900 

20 TCTCCGATAT CGCAATATAC ATTTTTAAAT ACACTTAACT GACTACCATC AAGTGTGGGA 960 

ATCAACAATC CTGATTGAGC CATAACAATA ATTAAACCTA ATGTTTTTAA TGTTACAGTT 1020 

TTACCACCTG TATTCGGTCC TGTAATAATT ACCGTTTCAA TATCTTCCAT AAATTCGATG 10 BO 

GTATTAGCTA CAACAGTCTC ACGATTTAAT AATGGATGGT ATGCTTTAGG TAAATATACA 114 0 

GTACGGTCCT CTTTAAATAT CGGCTTTGTT CCTTTAATAC TTCTACTATA TCTCGCTTTT 1200 

GCGATTAAAA AATCTAACTG ACCCATGACT TGTTCTGCCA CAAGTAGTGC ATCTTTGTCC 1260 

GCAGCCACAT AACCAGTTAG TTGCGTTAAA ATGCGTTCTT TTTCAATTGC TTCGTCATGA 1320 

. CGTAATCGAC TAATTTGATT ATTCATTTCA ACAACTGATG ATGGCTCAAT ATACAATGTT 1380 

35 TGTCCTGAAG CAGATTGATC ATGTACAATC CCATTAAAAT CTTGTCGATA TTCAGCTTTG 144 0 

ACAGGTATAA CGTTTCTTTC ATTCCTAACT GTTACAATAG CATCTGATAA TTTTTTCTGA 1500 

TTTGCTTGGC TTTTAACAAT ACGGTCCAAA TTTTGTCTAA TACGTTGATT CGTGCTAGAA 1560 

ATTTTACTTC TAATCCCTTG CAATTCATAA CTCGCATTAT CATATAAATC ATACGTATCG 1620 

CATGTTTCAT TTATTTGTTG AAAAAGATCA GTTAACACAG GTAATTGATT CATCTTGTCA 1680 

TCTAATATTG GGTATTTAAC ACCTTCATCT TCTTCAACCA ATTGATTATA AAATGTCTTG 174 0 

AATTGATTTT GTACTTGAAT TAATCTTTTT ATCAAGTTAA GCTCTGATAC ATTTAAAACG 1800 

CCGCCAATAT CAGCGCGATG AATGAATGCT GATACTTTAG ATAAGCCACT CAAGCTTGGT I860 

AAACGATGCT TATTATAGAT TTGAGCAATC TCATCCGTTT CTTCCATTTG AAAAACAACC 1920 

GTTTCAAAAT TAGTAGCTGG CATCATTTGA TTGACCTTTT CCAAGCCTAA GTCACTAATA 1980 

GTTTCATTGG CAACGAGTGA TTTTATTTTT TCAAATTCTA AGACGTCTAA TGTTTTTTGT 2040 
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TCACGCGATA ATGCGTTAAT 


CACTCTATCT 


TTTGTtACAA ATCCTTTTTG 


CGCAGTTGtA 


2160 


5 


CGCCATAATT 


CATAAAATCT 


AAATGATTTG 


TATGATGCGC 


ATCAGTGTTA 


ATAGTTAATT 


2220 




TCACATTTGG 


ATATTTACGA 


ACGATATCAG 


CGCTCAGATC 


CAGTCGATGT 


GGATTGGCAT 


2280 




TAATTTCTAA 


TACTGTATTC 


GTTTCTTCAG 


CTAATGCCAT 


TAATTGTTCA 


ATATTCGGTT 


2340 


10 


TATAACCATC 


TCTTCTACCT 


ATAATACGCC 


CTGTTGGATG 


CGCTATATGT 


CGCACGTATG 


2400 




GATTGCGACA TGCATTAGCT 


AATCGTTCCA 


TAATTTGTTC 


TTCTGATTGG 


TTAAAGCTTT 


2460 




GATGAATAGC 


TCCAATTACA 


TAATCAAGTT 


GTGCTAAAAT 


TTCATCATCA 


TAATCCAGCG 


2520 


15 


AGCCATCAGG 


TAATATATCC 


ATTTCTGTAC 


CTGAATAAAT 


ATCAATTTCA 


CTATATTCTT 


2580 




TATCTAAAGC 


CTTAATTTCT 


TCGTTTTGTC 


TTAAAAGTCT 


TTCTACTTGT 


AAGCCATTAG 


2640 




CAACACGTAA 


ACTTTGTGAA 


TGATCAGTAA 


TTACCATGAA 


TTTATAACCT 


TTTGCGATAT 


2700 


TTGCTTCTAC 


CATGTCTCGA 


ATAGAAAACG 


CACCATCACT 


ATACGTTGTA 


TGCATATGAA 


2760 




TATCACCATT 


AATATCATCT 


ATTGTAATGA 


TATTACTTAG 


ATCTTTATCA 


AATTCGCTAC 


2820 


25 


CATCTTCTCG 


CATAGCAGGT 


GGTATAAAAT 


TCACATTAAA 


ATGTTCATAT 


ATCTTGGCTT 


2880 




CACTATCATA 


TTGAATTAAT 


GTACCATCAG 


CTTGTTCAAT 


TCCATATTCA 


CTTACTTTTT 


2940 




CATCACGTGC 


TTTAGCAAGT 


TGTCGAATTC 


TTATATTATG 


TTCTTTTGAC 


CCAGTAAAAT 


3000 


30 


GCTGCAATGT 


ATGATAAAAA 


GCACTTGGTT 


CAATTAATCG 


AAAATCGACA 


CCAATCGTTT 


3060 




CATCATCATA 


CGCTAATTCT 


AATGAAACTT 


TTGTGTTCCC 


CACTGCAACT 


TCTTTTACTT 


3120 




TATTGGGAAT 


ATTTAATAAT 


TGCTGCTGCA 


CTGCTTTTGG 


GTTATCGGTA 


CTTATTATGA 


3180 


35 


AATCTAAATC 


TTTGCTCATT 


TCTTTAAAAC 


GACGGAAGCT 


TCCTGCAGAT 


GAATATTGAT 


3240 




CGATATAATT 


TAATGTATCT 


ATATAATCAA 


TGATTTCTTG 


ATTAAGTCTT 


CTCATTTGAT 


3300 


40 


CAATTGGATA 


TCTATCTTTC 


TTAGCACCAA 


GTTGTTTCAC 


AGCTTCTAAT 


ATGTTTTGTT 


3360 


CCGTTTTCTT 


AGCAAATCCG 


CTTAATTCAC 


TAACTTTTCC 


ATTTTCACAA 


GCAACTTGAA 


3420 




GTGACGCTTT 


ATCAACAATA 


TTCAACTCTT 


TATATAGCTT 


AGCAATTTTC 


TTGCTTCCAA 


34B0 


45 


GTCCTTGAAT 


TTTCAAAAGT 


GGAATAAGAC 


CTTCCGGAAC 


TTCTTCCTGT 


AATTGCTGTA 


3540 




AATACTGAGA 


TTCACCGGTC 


TCACGGTAAT 


CATTGATTAC 


TTCTGCAACA 


CCTTTACCAA 


3600 




TGCCTTTtAA 


CTCCGTtACA 


TCAGATATTT 


CATCTAATGG 


TCGTTCATCT 


AATTCAAGAC 


3660 


50 


TTTGAGCTGC 


TTTTCGaTAC 


GCTGaTATTT 


TAAAAGTATT 


TTCCCCTTTT 


AATTCCATAT 


3720 




AAGTAGCAAT 


TTGTTCTAAT 


AGTTTGATAA 


CATCTTTTTT 


TGTCATAATA 


ACACTCCATA 


3780 




AAAAGAAGAC 


CAGGACGTAT 


CATTAATATA 


TACCTTTGTC 


CTGACCTCTT 


ATGATAATTT 


3840 
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5 



10 



25 



30 



35 



TAGATATTTT 


AAGCTGATGT 


TGTAATGCTT 


CGTTAGGATA TAATGCCAAT AGATATAACG 


3960 


TAAAGTGTAA 


GACAATTATC 


GTCATAAACA 


CACCAACTAT CATTCCCATT GCACGACTGA 


4020 


AAATATGAAT 


GTTTTGATAC 


GCTATTATTT 


TATCAAAAGT 


TACGATAATT 


AGATATAAAA 


4080 


TGAACI1 A CA 


AAACAATGTA 


ATCATTAAAA 


AAGCTACAAT 


CGCTTCAAAT 


CGATTTTGTA 


4140 


GATGATTAAA 


ATGAAACGCA 


AAAGTTGTAT 


TAAATGCTGT 


TGTTTTAGGA 


TATGGAATAA 


4200 


ATACAATTAA 


TCTTTCTACA 


ATAGATTTGT 


AAAATTGACT 


GGCAATCCAC 


AATGATACAA 


4260 


nCGTTGCACT 


CAAATGTATC 


ATAGATAACC 


AAAAACCTCG 


TCTGAATCCA ACGATGACAA 


4320 


AATACACAAA 


GAAAATGATT 


ATGATAAAAT 


CAATGACCAT 


TTATTGCTCA 


f-*t~> /"*rrV"i /""MTV"! O * 

CGCTGCTGCA 


4380 


ATTTGTGAAT 


TTGTTGTTTC 


AAACGTCGAT 


XX 1XXX1^.XX 


CTAGTAGTAC 


l l~l"x"TCATGC 


4440 


ATAATATTCA 


CAGCAGTTAG 


TATTGCTTTT 




CTAAACCTGC 


TGCTTTATAC 


4500 


CCTAATTCTT 


TTATTTTATC 


ATCAACTAAA 




ATCGTATGTG 


CTCTGGGTTA 


4560 


TCTTCCCCAA 


CAATTGTAAA 


AAGCTGATCA 


TT A ATTfi AT & 
x XAnx ivjnin 


CATTTACCTT 


GTTTTTAAAC 


4620 


TGTGTCATTT 


ATAATTTCTC 


CTGATCCTTT 


TTTTA AA ATT' 
xxx innnni\» 


TAAATTCACG 


TTATAAAATA 


4680 


TGACTGGATA 


GTTTGTCTGA 


ATTTGATACT 


A ATA "d r V PA 
.nnx f\± J. v7 x x 


TATTGCAATT 


ATGATAAAAC 


4740 


AACAACACAA 


TCTCTATAGA 


TGACTTAATG 


TTCTTTTTAT 


AATGAAATAA 


TGTAAAGAAT 


4800 


TTTCTATTCA 


ATACTTTATC 


ATGTTTAAAT 


TGTGTCACTA 


TAACATTTTC 


ATAAACATTA 


4860 


TACATGACCA 


CTATGTATTT 


TGTAAGTATC 


CGCAATTAAT 


TCTTTACAAC 


ATACATAAAT 


4920 


GTTTCTGACG 


TTATTATCAT 


TTATGATATG 


A1TATTTTTG 


CTAAAGACAA 


TGAAATTTTA 


4980 


TGAAAGGATT 


TACACAAATG 


GCGAATATCG 


TTTTTAAATT 


GTCGGATAAA 


GACATAACGA 


5040 


CATTAATGTC 


ACGCATTTCT 


TTTGATACTG 


AGAATTTACC 


TCAAGGnATG 


AnAGCACGTG 


5100 


CAAAGTATCC 


AAAATACAAC 


TGTAAATATT 


TACCAT 






5136 



40 

(2) INFORMATION FOR SEQ ID NO: 333: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 4239 base pairs 

(B) TYPE: nucleic acid 
45 (C) STRANDEDNESS : double 

<D) TOPOLOGY: linear 



SO ' (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 333: 

GGCCAAAATT GCACCTCCAC TTTCCTTTGA ACAAATCTAT TTTAAACGCA CATTCCCATT 60 
ATGACAAATT AAATGTGAGT nACATTTGTT TGTATTTTAA CATGACTACT AACGCAAACT 120 
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GGTATCTTTC AAAGATAAAA TCTTAATAAT TTCTTAGTAA ACTCTTTTCT CTAGATTTAT 240 

CACAATATTA TATAGACCTA TTTTATTTTG ACGTAAGTTG CTAGTATCTT CAAACAAAAA 300 

5 

ACCTTTATAA aaattCATAC CXTXATGCTA JCGCTGTAGG CTCATTAACT TGTTACATAT 360 

AATTCTTAAC TATCCTTTGA TGATTGTTTT ATTAGATTGT TTCGTTGATG GATACTTTCA 420 

CGAATTTCTA TAGTTCAATG CTACTAAAAA AACAGCCCAA AACTTTAATT TGTTTTGGAC 480 

10 

TGTTTTATAA TTATGCTTGC GATGGTGTTT TAGTTTCTGA AGTTTGTTCA GCAATGTCAT 540 

ATTTAAACTC TTTACCATCA TGATCTACTG TAACTTTCTT ACCTTCAATT TGATTACCAT 600 

15 CTAATATTAA TTCACTTAAA TTATCTTCGA TAGTTTTTTG TATCGCTCTA ATTAATGGTC 660 

TTGCACCATA TTCTGGATCA TATCCTTCTT CTGCGATTTT GTCTTTCGCT TTATCAGTTA 720 

CAATAATATT TATGTTTTGT TCAGATAATC GATTTGTTAA TTTATTAACC ATCATTGTTA 780 

20 CAATTTCTTT TAATTCTTCT TTTGTTAGTT TATGGAATAC AATGATATCA TCTACACGGT 840 

TTAAAAATTC TGGACGGAAT GAATTTTTTA ATTCTTTTAA CATCGTTTTT CGAATTGTTT * 900 

CATAATCTTG TCCATCACTT GAACCACCGA ATCCAGCAAA TCGTTGATCT TGTAATTCTT 960 

25 

GTGCCCCAAC GTTTGATGTC ATTATGATAA TTGTATTTCT GAAATCAACT GTACGTCCTT 1020 

TTGTATCTGT CAAATGTCCA TCATCTAAAA CTTGTAATAG AATATTAAAT ACATCTGGAT 1080 

GAGCTTTTTC AATTTCATCA AATAAAATTA CAGAATATGG TTTACGTCTA ACTTTTTCAG 1140 

30 

TTAATTGTCC ACCATCATCA TGACCAACAT ATCCTGGAGG AGCACCAACT AATCGGCTCA 1200 

CTGCGTGTTT TTCCATAAAT TCACTCATGT CTACACGGAT CATCGCATCA TCATCGCCAA 1260 

35 ACATTGATTC AGCTAAAGCT CTAGCTAATT CAGTTTTACC AACACCAGTT GGTCCAAGGA 1320 

AGATAAAGCT ACCAATTGGT CGTTTAGGAT CTTTTAACCC TGCACGGGCA CGTCTAACCG 1380 

CTTTACTGAT TGAATTAACA GCATCTTTTT GCCCAATAAC TCTCTCATGT AATGTATCTT 1440 

40 CTAGACTAAG AAGTTTTTCA GATTCTGTTT CATTGATTTT AGTTAATGGG ATACCTGTCC 1500 

ATCCTGCAAT AACTTCAGCA ATATCTTCTT CTGACAATGA AGTTGaCATG CCATTTTGTG 1560 

CATTCTTCCA TTCATTTTTA GCTTCTTCAT ATTGCTTTTC AAGTTTTGTT TGTTTATCAC 1620 

45 

GCAGgTTAGC AGCATTTTCA AACTCTTGAG CATGTACTGC GGCATCTTTT TCATTTTTAA 1680 

CTTTTTCAAT TTCTTGTTCA ATTTCTTTTA AATTATTAGG TGTCGTATGA CTCTTAAGTC 174 0 

5Q TTACTTTAGA ACTTGCTTCA TCAATTAAAT CAATTGCTTT ATCTGGTAAG AAACGATCTG 1800 

AAACGTATCT GTTACTTAAT TTAACAGCTG CTTCAATAGC TTCGTCTGAA ATATTAATAC 1860 

GATGGTGTGC TTCGTAACGA TCTCTTAATC CTTTTAAAAT AGCAACTGTA TCTACTACTG 1920 

55 
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TTTTGCGATA TTCATCTAAT GTAGTAGCAC 
CCGGCTTCAA AATATTCGAA GCATCGATAG 
5 TATGCAACTC ATCAATAAAT AGGATGACAT 

TTTTCAGACG CTCTTCAAAT TCACCACGAT 
CTAAAGACAT AACACGCTTA TCTTTTAATG 

10 

GCGCTAAACC TTCAGCAATA GCAGTTTTAC 
TGTTTTTCGT ACGTCTACTT AATACTTCAA 
TAACAGGATC TAATGTACCG TCTTTGGCAA 
AAGTTGGAGT ATTATTTGAC TTACTAGCTT 
CTAAAGCTTT CACAACTTGT GCACGTGCTT 

20 CTCTTGCTGC AACACCTTCA TTTTCACGAA 

CAAAATTGTG ATGTAATTTT CTAGCTTCAT 
TAGGTGTATA ATGCAATGTA CCAACATGAT 

25 CTTCAATTAC TTTATCTTCA GTGATATTAA 

CAGGTTCTTT CATTAACCCC AATAATAGGT 
GAATTGCTTC TTCTTGGGCA TGTGCTAATA 

30 

ATAACATAAA TAATGACCTC CTACTTTATA 
TTTACAGATT TGTCATCTTC TTCATCTAAT 
TCATTAAATT TAAAGTTTTG TAATTCAATG 

35 

TTAATCTATA AGAAGCCTCT TCCATAGTTA 
AGCGAAAAAC ACGGTCTTGT GTTTCTAATT 

40 GTTTTTCTTC ATGAATGATT TGATTAACAA 

CAGATTTACC AAGTGTAAGT TGGTTGGATA 
CTTCACCGTA AATACCTCTG ATTGTATATC 

45 TCATTCTTTT CATAATAGAT AGACCTGGCA 

TACCTATATT GGTAGGACAT GTAGTTAAAT 
GGCTTCGATC TAATTCATCA TCAATTGATG 

50 

TGTCAGTTCC CATAGCTTGA ATACGAATAT 
ATTCATCGTC ATTCACTAAT ACTGCGGCTG 
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CAATACATTG TAATTCACCA CGTGCTAATG 2040 

CACCTTCAGC ACCACCAGCA CCAACTAAAG 2100 

TACCTGCTTG TTGGATTTCT TCCATAACCT 2160 

ATTTAGTACC TGCAACTACT GTTCCCATAT 2220 

TCTCTGGTAC CTCATTATTC ACTAtGGCtT 2280 

CAACACCTGG CTCTCCAATA AGCACAGGAT 2340 

TTACACGTGT AATTTCTTTA TCACGTCCTA 2400 

TGACTGTTAA GTCACGAGCT AAACTATCTA 2460 

GTGCATTTTT ATTACTCATT TCAGGGTTTC 2520 

TAGTAATATT TAAATCTAGA TTTGCAAAAA 2580 

TCAAGCCTAA TAAAATATGT TCCGTTCCAA 2640 

CCATCGATAA TTCAATGACT TTTTTAGCTC 2700 

CTTGACCATG TCCGATTAAT TTTTCAACTT 2760 

AACTTTCTAA TACTTTTGCA GCAATTCCTT 2820 

GTTCTGTTCC TATATTTGAA TGATTTAAAC 2880 

CGCGCTGTGC ACGCTCAGTT AATCTACCAA 2940 

TGTTCTCTTA GTATATCTGC TCGTTTTTCT 3000 

AAAAATGGTG ACTGTATAGC TACCATCAAT 3060 

TAATTTAAAT CTATACCAAG TTTAACTcGC 3120 

TCATTCTACA GTTTTGTAAA ATACCTAGCG 3180 

GATTATAAGT GTCTAACTTT TGTCGTATTT 3240 

CTTCTGTTAA TGTTTCTATG ATTTCTAACT 3300 

CTTGATAAGT ATGTCCATAA ACTTGCGAAC 3360 

CAAAACGATT AATGGTTTGA GCAATCCGTG 3420, 

AATGTAGCAT CACGCTTGCT CTCATACCAG 3480 

AACCAAGTTG TTCATCATAA CTTATATCAA 3540 

AAGCTTGATT ATATAAAGCC TGTAATGTCG 3600 

GGTCCTCTTC ATTTATCATG ACACTTAAAG 3 660 

CTGGTTGTTT TATTAGTTCA GGACTAATCA 3720 
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CAAAGTTTGG CAAGGCATCT TGTACCTCAT TTATAACTCT AAATCCcATC ATTTTCAGTA 384 0 

GCATACATTA GTGGATGCAC ATGATTTTCT AAAtTACGCG CTAACCGAAT TCTAGAAGAC 3900 

ATAACAATTG GTGTTTCTTC ATTACTTTTC ATCCATTGGC TGATATTATC ATGAATATTA 3960 

TGCGTCATCA TGTTGCACCT CACTCTCAGC TTTTAGTGCT TTAATTTCAT CTCTAACAAT 4020 

GGCTGCTTCC TCAAAATCTT GGATTTCAAT AAGTTTTTTC AAATATTCAT TCTTTTCTTC 4080 

GATTTTTCGC TTTAAAGCTA TCTTTTTATG TGAAGAATGT GGTGTCTTTC CAACGTGCTC 4140 

AAATTGTCCA CCTTGAACTC TGCGGACGAT ATCAATGATG TCATCTTTAA ATGTTGcATA 4200 

ACAATTAGCA CACCCAAATT TACCAACATG TGCAATATC 423 9 
(2) INFORMATION FOR SEQ ID. NO: 334: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1245 base pairs 
20 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 334: 

CAAAACTTTG ATTATGTCGT GTCAGTTATT AATGCATACA GTAATGCATC GTTGTTATTT 60 

TTTATTTATT TACTATTTAT TATGTACCAA ATCAGCCTTt CAGTAAAATA GGTCAAATTA 120 

CTGATTTTCT AAATATAAAA TGCCTCCTAA TAACATACTA TTAGTACATC ATTAAGAGGC 180 

TCTTGTGTTA TTTGCATACT AAGCGCTCAA ATTTAAATTT AAGATGAAGA TTCTTGCAAT 240 

AATATTTCTA TATTTGTCGA TATATCCAAT GGATCTTCCA TTGGCAAGAA TCGATTTACA 300 

ACATTTCCTT GTCGATCGAT TATAAATTTT GTGAAATTCC ATTTTATTGG GGaCCCAAAG 360 

ATTCCTGGTT GTTCaTTCTT TAAATGCGtA AATAACGGAT GTTCATCGTT CCCGTTCACA 420 

GATATTTTAG CTAACACTGG AAATGTTACA CCAAATTTCT CACGACTAAT TTTCAAGATT 4 80 

TCTTCATTAG AACCTGGTTG TCGATTGTCA AAATTATTAT TCGGAAAACT CAACACTACA 54 0 

AACCCACGAT CCTTATATTT TTGAAATAAA GTCTCTAGTT TTTTCAATTG TTCGCTATAT 600 

ATACATTCTG TTGCAGTATT AACAACTAAA ATCACTTTAC CTCTAAATGC TTCTAATTTA 660 

TAAGTTAAGC CTTTATAATC ACTTACTTCG ATATCATACA CATTTCTATT ATTCATAAGA 720 

CACCCCTACA CAGCCTTTTT TATATTGAAT ATGTTCTTTT TAGAATGTTC TGATAAAATA 780 

AGTGCGCGTT TACACCGTGA ACACACATTA TATAGCGTGA TACATTTTTC GAGCACACGA 840 

TAAATAATGT TCGAGTTTAT GTTGTTGCTC AACCTATCCG ATTTACCGTC TTTTTTCACC 900 
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CCGTTATAAC CCCTCATTAT AATCATCCTT ATTTTCTATT TTTAAAAAGA CAATTAGACC 1020 

GCTCTTTAAA CTATAGaTTA ATACTTAAGk TAAACTCATA CATACTGATA CCATACGTTA 1080 

GATCTAACAA TTTAAAATTC GTTATAACTA TGGATTAAAG AGCTGCCCAA CTCATATAAT 1140 

CCTTAAAAAC TTCACATGTG ATTGTkTATT AAGCCCTCCT TTATCnTATT AAATATCCTT 1200 

ATAACCCTTT TAAAATTAAA CTGACACACT CATACATTGT TACAC 1245 



10 

(2) INFORMATION FOR SEQ ID NO: 335: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1399 base pairs 
15 (B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 335: 



25 



30 



35 



40 



45 



50 



CTTGTAAAGG 


TAGTTGTTCA 


TTTAAATTAA 


AACAGTATGC 


TAAGTTnGTG 


CTTATATTTT 


60 


GCAACTTCAA 


TTCGACAGGC 


TCATCTTGAT 


ACATGAATGC 


CTCAATTTCA 


TCATGTGATA 


120 


ACTTTTTCAA 


AATATCAATT 


AAATGrATAC 


TAAAAACGAT 


AAATAACATA 


TCCCAATTTG 


180 


AATTCAGCCC 


TAGCGATTTT 


AATTTGTTTA 


AAATCTTATC 


TTTTTGAAAA 


ATTCGATTCC 


240 


TAATGTCTTG 


TATATCGTTA 


TCAGTCAAAG 


TTTCCCAATC 


TATATGTGAA 


TGAAGACCTA 


300 


AATAACACTT 


ATCCATTAAT 


AATTCATATA 


CCGTTAATGC 


AGAGACATCG 


AAACAACGTT 


360 


CTTCACTTAr 


AAAAACGCCA 


TCAACATCAA 


ATAAAATTTT 


CTTCACAATC 


CCCACTCCAT 


420 


TTCTGaAAAT 


TCAGaTATAA 


ATCATTCTAC 


TATTTGACTA 


AAAAAAGCGC 


AAACCCTATT 


460 


GAAGTaGATT 


TGCGCTTTAG 


CTGTTnAAAT 


TTTATAAATG 


TnTTTCAATT 


TCATCAGCAA 


540 


CCTGCTGTAC 


GTGTGTACCG 


ACAATAACTT 


GAGTTGAATG 


TTTGCCATTA 


ACAGTAACAC 


600 


CAACTGCACC 


GGCGTTTTTA 


ATCTTCTGTT 


TATCAATAAT 


AGATGTGTCT 


TTTAACTCTA 


660 


GACGCAACCT 


TGTTGCACAA 


TTGGTTAAAT 


TAACAATATT 


CTCTTGACCG 


CCTAAACCTT 


720 


CTAATATTTG 


TATAGCATGT 


TGATGATATT 


TACTTTGTTT 


AATATCATTT 


TCACCAGGAG 


780 


CAATATTATC 


TTTTACAACT 


GTTGGGTCAA 


CTAATTCATT 


TTCACCTCTA 


CCAATCGTAT 


840 


TCAAGTTAAA 


TACTTGGATT 


ACTACACGGA 


AAATCACATA 


GTATAAGATG 


AAAAATACAA 


900 


CACCTTGAAC 


AAGCAACATC 


AATGGATGAT 


TTGATACTGG 


ATTAATTAGT 


GATAACACAT 


960 


AATCTATCAA 


ACCTGCACTA 


AATGAAAATC 


CAGCTGTCCA 


ATGGAATGTA 


GCTGCGATAA " 


1020 


ATAAAGATAA 


TCCTGTTAAT 


AACGCATGAA 


CAACATATAA 


GATTGGCACA ACAAACATAA 


1080 
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ACCAACCGTA AACTTGTTTT TTCTGAGTAG TTTTAGCTGT ATGATACATT GcTAACGCAG 1200 

CCGCTGGAAT ACCGAACATC ATGATTGGGA AGAATCCCGC TTGATAGCGT CCTGTAATAC 1260 

CTTTTATAGC ATCTTTGCCA CTTTGGAATT TACCAATATC ATTAATACCA ATCGTATCAA 1320 

ACCAGAACAC ACTATTCAGT GCATGATGTA ATCCTGTAGG AATTAATAAT CTATTGGCAA 1380 

CACCATATAT GAAAGCTCC 1399 



10 

(2) INFORMATION FOR SEQ ID NO: 336: 

(i> SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1329 base pairs 

(B) TYPE: nucleic acid 

15 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



20 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 336: 



25 



30 



35 



SO 



1A1 Ao 1 III 1 A 


TTATTTAGCG 


AAGCATTAAT 


Tk. s^T'Ti /**f*y\ f*r*r* 
ACTACCACCG 


GTTATAACAA ATGTATTTTG 


60 




i IjAA 1\j\3 1 Ab 


QiACtiAA 1 L-AA 


AblAl Al I CA 


ATCGCTGGAC 


CATCATTGTT 


120 


AATTAATGAC 


TGCGCAACCT 


TAAAACTAAA 


TTGATCCATG 


GCACCTGCGC 


CTGAAAATCC 


180 


AATATGTTCA 


TAACCTATTC 


TTCCTAGATC 


TTGTACCGTT 


GAAAAGAGAC 


CTGGTTGTAA 


240 


AATCTTAATT 


GACATTTTCA 


ATCACCACCC 


AGTCATCAAC 


ATTAAAGTTG 


CCATCTGATA 


300 


TATCTCTTTC 


GATTTGTATA 


AATTTCTGTT 


CATCTATTGC 


ATAAAATTGT 


ATCCATTCTC 


360 


CTGCTTCGTA 


CATTGACATT 


GGTTCACGCT 


CGCTGCTAAA 


TACTTTTAAc 


GGTGTGCGTC 


420 


CAATAATTTG 


CCATCCGCCA 


GGAGAATCTG 


ATGGATATAG 


TCCTGTTTGA 


TTATTCGCAA 


480 


TACCTACAGA 


ACCTGCATGA 


ATTTTTAACC 


TTGGCTGATT 


ACGTCTAGGT 


GTATGTAGTT 


540 


GTTCATCAAG 


TcCGCCTAAG 


TATGGAAATC 


CTGGCATAAA 


TCCTAGCATA 


TATATTAAAT 


600 


AAGGTTTACT 


TGTATGTTTT 


TCAATAACTT 


GCTCAACAGT 


TATTCGATTA 


TGCTTTGCTA 


660 


CTTCTTCAAT 


ATCTGGTCCA 


TATGTACCAC 


CATATTGAAC 


AGGTATTTTA 


ATAATACGAT 


720 


TGGTTTGATT 


CACAGCATGA 


ACATTTTTTT 


CATTAAATTT 


GTTAAGTTCT AAATTTTCAA 


780 


TTAATTTAGA 


AGATGTTATA 


GCTTGTTCAT 


CAAAATATAT 


TAGAACTGCT 


CGATACGAAG 


840 


GGACAATATC 


TTGAATTTCT 


AATATTTCTT 


TTTCTCGTAT 


CCACCGTACC ATTGCTGTGA 


900 


CATTACGATA 


TGTCTCTTCG 


GATATTTTAT 


TTTCAAAATA 


AATCATAATT 


GTCTGCTCGT 


960 


TAATAAATCT 


TACATCCACT 


TTAAATCCCC 


CTTTGTATTG 


CAATAAACCA 


GTATTGAATA 


1020 


CCTTTTCATT 


GTATCATTGA 


GAAGCACAAG 


TTGTTTAATA 


AGTAATTCAA ATCGCATATA 


1080 
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TTAATATTGT AACTCTTACA CTAATTTAGG TTCTGCTATC ATTCGGTCTG ATGGAAAATT 1200 

TTTACTTTTC ATCTGTCCGA TTTTTTGATT TTGAATATAA AAAAGCACGA CCGAAGTATC 1260 

5 ATTAACACAC TTCAATCGCG CAATTAAATA ATCTATTTGA TCATTTATTG GATATTAACA 1320 

ATTTTTACG 1329 



(2) INFORMATION FOR SEQ ID NO: 337: 

10 (i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 3421 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

15 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 337: 

20 GAATAGTGCC ATTTGGAAAG ACATAAAGAA TCCAGAAGCA CCTTTAGCGA ATATGCCGTG 60 

TTCATATAGA TTTGTGAAAC TGGCATGCCC GAATTGAGTT TTAAATGCAA ATAGAATCAT 120 
GACGAAACCA ACTACTATTA AACCAATAAT TGTCGCTATT TTAATGATAG AGAACCAAAA 180 

25 TTCTAATTCT CCGAAAAGTC TTGCGCTAAG TAGGTTGAAT GACATTAATA ACAGTACACA 240 

AAATAGTGCA CTTATCCAGT TTGGAATTTC TGGGAACCAA AAGCTAACAT ATTTTGCCAC 300 
AGCCGTTACT TCAGCCATAC CTGTAATAAT CCAACAGAAC CAGTATGTCC ATCCGGTAAC 360 

30 

AAATCCTGCA AAAGGCCCAA TATATGTATT GGTTACATCT GCGAAAGATT TAAATTCAGT 420 
ATTCTGTATA ATGATTTCTC CTAAACCTCG CATAAACATA AATAACATAA ATCCTATAAT 480 
GATGTATGTT AATAGAATTG AAGGGCCGGT TAATGCAATC GTTTGACCAG CACCTAAGAA 54 0 

35 

TAAGCCTGTA CCAATTGCAC CGCCAATTGC AATTAATTGT ATGTGGCGAT TGCTCAGTTC 600 
CCTTTGTAAT TTTTCAGCCA TAATACATCT CCCTTAAATA TAGATATGTT TATTATGCAC 660 

40 TTATATTGAG ATATATACAA TTATTTTCGG TAAAAATGTG TAAAATTCCA TGTTAATATA 720 

CTTTGGTTTT TATAATCATA TATAATAACC AATTGAAAAT TTAATTCTAT TGTAAAATTC 780 
ATGGATTATT CACATCTTGA AAAAGCTTTA ATGGTGCTAT TTGTGGCTAT TCTGTGACAT 840 

45 TTACATAGAT TTACAAAAAA ATTGTTGCAC ATATAATGCC AGTtTTTATA TTTCACAAAC 900 

GAAATGCGTT TAcTATAATA TTAGTTGAAA GCCATTTCAT AAAGAAACAG TAAAGGGGAA 960 
ATTtATCaTA GCmGaATTAC AAAGAGGTTT AGAAGGGGTT ATCGCmGCGG AGACTAAAAT 1020 

SO 

AAGTTCAATT ATTGAAAGTC AATTGACTTA TGCCGGCTAT GATATTGATG ATCTAGCTGA 1080 
AAATGCGCAA TTTGAAGAAG TTATTTTCCT ATTATGGAAC TATAGATTGC CAAACGAAGA 114 0 

55 
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TACACATTTT GAGGAGTATG TTACAGATCA CGTGCATCCA ATGACAGCAT TACGTACGTC 1260 

ATTATCATAT ATTGCACATT TCGATCCTGA TGCTGAAAAT GAATCAGATG AAAATCGTTA 1320 

5 TGAAAGAGCA ATGCGTATAC AGGCTAAAGT AGCATCATTA GTTACAGCGT TTGCTCGAGT 1380 

AAGACAAGAT AAAGAACCAC TTAAGCCTAA TCCTGACTTA AGTTATGCGG CAAACTTCCT 1440 

ATATATGTTA CGTGGGGAAT TACCAACAGA TATAGAAGTA GAAGCCTTCA ATAAAGCACT 1500 

10 

TATTTTACAC GCTGATCATG AGTTGAACGC ATCTGCATTT ACGGCACGTT GTGCGGTATC 1560 

ATCATTGTCA GATATGTACT CAGGTATTGT AGCAGCCGTA GtTCTCTGAA AGGGCCATTA 1620 

CATGGTGGTG CAAACGAACA AGTTATGACG ATGTTATCTG aGATTGGGTC AaTTGAAAAT 1680 

15 

GTTGATGCTT ACTTAGATGA AAAATTTGCT AATAAAGrTA AAGTAATGGG cTTCGGTCAT 1740 

CGTGTATATA AAGATGGTGra tCCTAGaGCG AAaTATTTaA GaGAAaTGAG CCGTCAAaTT 1800 

20 mCGAAAGACG CTGGTCGTGA AGAATTATTT GAAaTGTCAG TGAAAaTGGA AAAmCGTATG 1860 

GCAGAAGAAA AAGGATTAAT TCCTAATGTT GATTTTTATA GTGCGAGTGT TTATCACTGT 1920 

ATGGAAATAC CTCATGACTT ATTCACGCCA ATCTTTGCTG TAAGTCGTTC TGCAGGATGG 1980 

25 ATTGCTCATA TTTTAGAACA ATATAAAGAT AATAGAATTA TGCGTCCTAG AGCGAAATAT 2040 

ATTGGCGAAA CGAATCGTAA GTATATCCCG CTTGrAGaAA GAAAmTAATC AATACAAATT 2100 

AAAAATGAAG ATGTAAAATT TGGAGGTAAA ATAACTATGA CTGCAGAAAA AATTACTCAA 2160 

30 

GGAACTGAAG GATTAAACGT ACCTAATGAA CCAATTATCC CATTTATTAT CGGTGATGGA 2220 

ATTGGACCGG ATATTTGGAA GGCAGCAAGC CGAGTTATAG ATGCTGCtGT TGAGAAAsCC 2280 

TATAATGGCG AAAAACGCaT TGAATGGAAA GAAGTGCTAG CTGGCCAAAA AGCATTTGAT 2340 

35 

ACAACTGGTG AATGGTTACC TCAAGAAACA CTTGATACAA TTAAAGAATA TTTAATTGCT 2400 

GTTAAAGGAC CTTTAACAAC ACCAATTGGT GGTGGTATTA GATCATTAAA TGTGGCTTTA 2460 

40 CGCCAAGAAT TAGATTTATT TACTTGCTTA AGACCGGTAC GTTGGTTTAA AGGAGTACCA 2520 

TCACCTGTTA AACGTCCACA AGATGTTGAT ATGGTTATTT TCCGTGAAAA TACTGAAGAC 2580 

ATTTATGCTG GTATTGAATT TAAAGAAGGT ACAACAGAAG TTAAAAAGGT AATTGACTTC 2640 

45 TTACAAAACG AAATGGGTGC GACAAACATT CGATTCCCAG AAACTTCAGG TATTGGTATT 2700 

AAACCAGTTT CTAAAGAAGG AACTGAGCGA TTAGTTAGAG CAGCTATACA ATATGCTATC 2760 

GATAATAACC GTAAATCAGT TACTTTAGTT CATAAAGGTA ATATTATGAA ATTTACAGAA 2820 

50 

GGCTCATTTA AGCAGTGGGG TTACGATTTA GCATTATCTG AATTTGGTGA TCAAGTATTC 2880 

ACTTGGCAAC AATATGACGA AATTGTTGAA AATGAAGGCA GAGATGCTGC TAATGCTGCT 2940 
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TTACAACAAA TTTTAACTCG TCCAGCTGAG CATGATGTTG TAGCAACTAT GAACTTGAAT 3060 

GGTGACTATA TTTCAGATGC TTTAGCTGCA CAAGTTGGTG GTATTGGTAT TGCGCCAGGT 3120 

GCAAACATTA ATTATGAAAC AGGTCATGCT ATTTTTGAAG CAACACATGG TACAGCTCCA 3180 

AAATATGCAG GTTTAAATAA AGTGAATCCA TCTTCAGTAA TTTTAAGTTC TGTATTAATG 3240 

TTAGAACATT TAGGATGGCA AGAAGCGGCA GATAAGATTA CAGATTCAAT TGAAGATACA 3300 

ATTGCTTCAA AAGTTGTTAC TTATGACTTT GCCCGTTTAA TGGaTGGtGC TGAAGAAGTT 3360 

TCTACATCAG CATTTGCAGA TGAATTGATT GnAAATTTAA AATAAGCAGA ATAGAATTAG 3420 

G 3421 
(2) INFORMATION FOR SEQ ID NO: 338: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3173 base pairs 
20 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



25 . (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 338: 

CCCTnGATAC CCAAACTGCC CTAATACCAC TGGCTAAACC TAATGGATAG TACCATTTAT 60 

TTTCCAATAA ATAAnCCAAC TGCAATnGCT ATaACTCTAA ATATAATAGA GATAATCmcA 120 
30 - . 

TTAATTGGAT TAAtACGCCA AATACTAGTA ATAATAGGCT AGATAATAAT CCACCTAAAA 180 

AGTACTTTTT AATTCCAAAG AAAGCTAATA TCAATAATGC TGCCGGTGCA GATAATTGAA 240 

AATCTAATCC TGGTATAATG GACGGTATTT TCAAAACTGC CAAAATGGTT AAAATCGCAG 300 

38 

CAATGACACT AATTTGAGTA ATATCTTTTG ATGTCATACT AAAACCCCTA TACCGTTTCA 360 

TAAACAACTT GCTTCGGTGT GCTTTCTAAA AATGATATGT AATGATTTAA ATCAATACAA 420 

40 TCGTCCACAA ATATTATTCT GCCTCCATAT CTCGTATTAA CTGGTTTAAT ATCAAATAAT 4 80 

CGATGGTAAC CAATTTTAGC AGCGGCAAAA TAACCTGTCG TATACGTTAA GTCATCGGAC 540 

ACGCAAAGTT CTCCTTTGAC ATACGGATGC GCATTGATAC AACTAGCAAT TGCTAAGGCA 600 

TCAGTCACTC TTTCATTAAG ATCACCTTTA TTATTTATAT CTTCAAACGA AAAATGTGTT 660 

GCCCTAATCC CCCTTTGTCC AAATGAATCT AAACGTTTAC CAGATATAGC AGATAGAATA 720 

ATAGCTCCTG TATAAACCGT TTCATTTTTA ATATATGTCA TCCCTTGATT TAGCGCTTGT 780 

TCAGTGACAC CACATTCTTG TGTTAAATGT TGGAGATTTG CTTTAT CATC CTCAATAATT 840 

TGTAATGCTT TTATTTGTTG AATCGGTTCC ATGATTTTTT GTATTTTTAT ATTGAGAAAA 900 
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ATTTTGTCAA ACTCACAAAT CGTTTCAGCA CCACTAATAT GAACATCTTG ATTGCTAGAA 1020 

CGCATTTTTA TACTATACAT GACGATCACC TcAATCTTCT TGaTGCAAAA TTTCAAACAA 1080 

CCTATCTATA TCTTGTTCAG TATGAAAATA CGACAATGAT ATTCTTAACA TTGGCTTAGT 1140 

CACAGTtGGA TACCTTAAAT AACTTGTAAA CACATGATGC TTTAATAATG TTTGATGAAT 1200 

GTTCTCAGCC GCTTCTATGT CATCAAACTC AATAAACTTA ATCGGCGAGT TTGaACTATT 1260 

ATAATkAACA TTGAGTGCTT TTAACTTTTG GTTAAAATAT TTACTCAAAC TATTTAATTT 1320 

AGTGCGTCTA TCATCAGCAT TTATTAACTT TTCAATGTTT CTTTTTATAA AATACAAATT 1380 

ATAAATTGGC AAACTACTTG AGTAGATGAG TGGTCTACCG TGATTAATTA aCATATCCtT 144 0 

CaCATCaTTT GaACTkaAAA TcACACCCCC GTATGCACCA CATGCTTTAG ATAAACTAGA 1500 

AGTGAGTATA TCTACACCTT GATAATTCGA GTAAtTCTCT ATtCCAAAAC TATGTGAAAC 1560 

2 0 ATCGAGTATC AGTGTTGCGT TAnATTTATG CTTTAATGAG ACTAATTGAC CAATATCCAC 1620 

AACGTCGCCA TTCGTTGAAA ATACACTATC AGATATGATT ATTTTTGGTA TATTTTGATT 16 80 

AGGGTATTTC TCTAACCTTT TTTCTAAATC AGCAATATCT AAATGCTTAT ATATCACTTT 1740 

25 TTCTAAACCA CTTAACTTAA TACCGTCAAT AATACTCGCA TGATTTTCTT GATCTGAAAA 1800 

CACGACACAA TTTGTATTTT TGAAAATATT AAATAACGCC AAATTAGCAT CATAACCACT 1860 

ATTTAAGATA GTACATGcAC TATATCCGAG CCAACCTGCT AACATTGTTT CAATTTCTTC 1920 

ATAAGCTGTC GAAGTTCCAC TAATTAATCT TGAACTTGAT AAGTGATAAC TATACTTCCG 1980 

CATAAATCTT TCGAAATCAT CCTTATCAAA CGCTATTTGA CCTAATCCTA AATAATCATT 204 0 

AGATGTATAG TTCGTACATC TCTTATTTTC TACTTCAATA TACTGTCTAT CTATATACCC 2100 

TACCGATTTA AGCGACCGAT ATAACCCTTT CTGTTGTAAT AAATCAATTT GCTCTTGAAA 2160 

CTTCATTCTT GTTTTCCTTA TTTTCACAAG TGTCATAATC AATTTCAAAG CCTAAATCAT 2220 

40 TAATCATATC GTAGTCTAAT TGGTTCGGTT GCCCACCAGT AATTAGATAA TnCACCGACA 2280 

AATATTGAAT TCGCCGCTTT TAATGCTAAT GGCTGTAACG AACGTAAGTT GACCTCTCTT 2340 

CCTCCAGCAA TACGAATTTC TTTCGTAGGA TTGATTAATC GGAATAATGC TACGATTCTT 2400 

45 AAACATTTCA TTGGTGTTAA ATCATCCATG CTTCCAAACT TTGTGCCTTT GATTGGATGC 2460 

AAAAAATTAA TCGGAATACT GTCGGCATCC ATTTCTTTTA AAGCAAATGC CATATCAACA 2520 

ATATCTTGAT TAGATTCTCC CATACCACAA ATCACGCCAG AACATGGTGA TATATTATTC 2580 

50 

GCTTTCATTA GTTCTATCGT ATCTGTTCTA TCTTTATAAC TATGCGTTGT CACGACGTTA 264 0 

TCATGGTAAT TTTCACTTGT ATTAATATTG TGGTTATATC TGTCTACACC AGCTGACTTA 2700 
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TGTTGAGATT TAATCGTTCT TACAGTATTA CTAATATGAT CAACTTCTTT ATCGCTCGGT 2820 

CCTCTACCAC TCATAACAAT ACAATATGTT CCAATATGAT TATCATGTGC CACCTTTGCT 2880 

5 

CCATCGATAA TTTGTTCCTC TGGAATTAAA GCATATCGCT GTTTTTGTTT AATATCTCGT 2940 

GATTGTCCAC AGTACCCACA ATTTTCAGGA CATATACCAC TTTTAGCATT TAAAATCATG 3000 

TTTAATTTTA CTTTTTTACC AAAATAATGT TTTCTTAAAA TGTACGCCTC ATTTAATAAA 3060 

10 

TCTAAGGTAT CAATATTAGT ATCCTCATAA ATtTTCAATA CAGTCTCTTT TGTtAATTGT 3120 

tCCCCTTGTA ATATGCGTTT AGCCAAATTC ATATTAACAC TTCCTATCTA AAA 3173 
1$ (2) INFORMATION FOR SEQ ID NO: 339: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 1694 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
^0 (D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 339: 

25 CGATTATCCA TTAATACAAC CCTAAGTAAA TGTATAAAAA TTATCTTCCA CAAACTTCAA 60 

CAAAAGCCTA AATAAATTAC AGCAATTTAT CAAATATTGC TTACTTTGAT TTTATGAAAT 120 

nACTTAATTC TAACACATAC TAAATCATCA TATACTAATT CGAAATCAAA TGCATTTAGA 180 

30 

GATAATCaAA ATGCGGAAAC ATCTCCaATA ATCAATAATC TATTCCCAAT AAATATGAAT 24 0 

GTTCTCAACA ATACATTATT TATATCTCTT TACACTGTCA TCGACAAAAA CTAAATCTTT 300 

3S CACTTTCAAT TTCGAACGTG GTTCTACGAC ATTTGCTGCT ATATCATTTA ATGGGATTAA 360 

AACAAATGCA CGTTCATTCA TTCTCGGATG TGGCACCGAC AGTTTTGGTA AATCTATCAT 420 

TTCTTCTCCA TACAACAAAA TATCCACATC TAAAGTTCTA GGACCCCATC GTTCCTTTCT 480 

40 AATACGGTGT AAACATTCTT CTGTCkTCAA ACAACATTCC AACAGTTGTA ATACTGTGAG 54 0 

TGTTGTTTsA ATTTCAACAC ACAAATTTAA AAAGTTAGGT TGCTCAGTAT ACCCAACTGG 600 

TGCTGTTTCA TAAATCGGAG AAATAtTAGA TACGTTAATA CCATCATATT CATTCaAAAT 660 

45 

CTTyATAGCA TCGTTTAACt GGCTTTCTCT ATCACCAaTa TTACTACCTA AyCCTAAGTA 720 

TGCTTGAATC ATyTATTCTC CCTCACTATT TCGATACCTA CTCCATCATA ATGACCCGGA 780 

ATCGGTGGGT TTTCTTTAGT GATTCTCACT TTCGTTTCCA TTACACGATT ATATTGTGAA 84 0 

50 

TTTATACGAT TTGCAATACG TTCAGCTAGA TGCTCAAGTA AATTAACGGC CTTACCTTCC 900 

ATAATTGATT TAACCTCTTC GAACACTTCA CCATAATGAA CTGTATCAAT AACATTATCA 960 
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ATTTCATTTT CAGCTGATAA AGCACCATGA TATCCATAAA AGCGCATACC TTTAAGAAAG 1080 

ATTGTGTCTT GCATTTTCAT TCTCCTTTAA AAAATCTATA CCTTTAGCTA ATTTAGCATT 1140 

5 CAACTCGACA TTATGAACGC GTACTGCTCT AACGCCTTTC ATAATACCAT ATGCAGTCGT 1200 

AGCTGCAGTT ACTTCATCTC TTTCAACCGG TGTTGTATCA TAACCCATCA TCTCTTTAGT 1260 

GAAACGTTTC CGGCTTGTCG CTAATAAAAC TGGATATTCT GTTGCAACAA GTTCATCCAG 1320 

10 

TCTTGCCATA ACTTCGGCTT CTTCATTTCT AGTTTTAGCG AAACCTATAC CTGGATCTAG 1380 

CCAAATTTTA TTTGAAGGTA TACCAGCTAT TTTAGCTTGA TGTGCTTGTG CTAACAAAGA 1440 

TGTTAACATT TCTTCGACAA CCGGTTCATC ACGATTACCA TTTCCATTAT GCATTAAAAT 1500 

15 

AATTTCCGCG TCATAtTTAG CTACAATTTG GAACATACGA TGATCATACA GACCgCCcAT 1560 

tGATCATTAA TCATATCAAC GGCTAATTTT AAACATGCTT CAGCAACCTC ACTTCGAAAT 1620 

20 GTATCGACTG AAATTTTTTA CATCAnAACC GACAATAGCT TCAnCAACAG TAATACTCTG 1680 

TTCCATCTCT TCTG 1694 
(2) INFORMATION FOR SEQ ID NO: 340: 

2S (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1358 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

30 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 340: 
AGCATTTCTT TTCTATAAAC ATTTAATTGA ACATTATTAA GTACACTATT ACTATAGTCA 60 

. 35 

CTATATTGAA CaCATACCTC ATTTAATTCT AATAGCGGTT CAGATTTGTA CTTATTATCA 120 
TTATTTGCAG ATGTTTCATC TATCCATTTT TTCACTTTAA ATTTAACATG TTCACTCATA 180 

40 CAAACGTCAC GTAAATTCGC TAAGTTATCA ATGGATTCGA CATCTACTTC TGCATATTTA 240 

AGCGCTGTAC AGTATAATGG TTCACGTATG CCTGCTTCTT TAAGCTTAGA TGATTTTAGC 300 
AAATCACTAG GCGTTGTATT AGCGATGATT TTTCCATCTT TAAAAAGAAG AACTCTATCA 360 

45 AACGTATCAT CTAATGATTC TTCTAATCGA TGTTCGACAA TAATCATCGT TGACTTTGTT 420 

TCTTCATGAA TATTGTTTAA CAATCTCAGC GTTTCATGTC CTGTCGCAGG ATCTAAATTG 480 
GCCAGTGGCT CATCCAATAT TAAAATAGGC GTACGATGGA TTAATATACC ACCTAATGAA 540 

50 

ACGCGTTGTT TTTGACCTCC AGATAAATCT TGCGGTCGGT GATTTAAATG TTCTATCATG 600 
CCAACTTTTT CAGCCCAATA ACTTACATTT TTCTTCATAT CATCTTGTTC AACACAATTA 660 
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TCTTGTAAAA CTGTACCAAC AACATTAGAT CTATCATGTA AACAACTAAC GGTTGCATCT 780 

TGATTATTTA TATATAGTTC CCCAGTTATG TTACCTTTAG TTTTAAATGG AATTAATCCG 840 

5 TTTATGCAAT TTGCAAAAGT CGATTTACCA CTACCCGAAG CACCAACTAC TAATACTTTT 900 

TCTCCTGGAT AAATATCAAC ATTTATATTC TGTAATGTAG GTGTTGCTTG ACTATGATAT 960 

TGAAAACTAA AGTCTTTGAA CGAGATAATT GGTTCAGTCA TGATATATCA TTACCTTTCT 1020 

10 

ATATTCATTT ACATATCTGA TTCAACAAAA TAACTATTCC TTACGTAAAC TACCTTTTTT 1080 

AATTTGAGAT GAaGCATATG CTTTTAATAA TATTGTCCCA ATAATGCCAA CTGAAATAAT 1140 

1£ ATTTAATACT GCAGAGATAA CACCTTGTGT ATAAACCTTG TTAGCTGGTT CGTTATAAAT 1200 

CAAAATATCT AATGTTGGTG CAATAAGTGC CCAGCAAATA ATATTCGCAA TAATTTGACC 1260 

GATATTAAAA TAAACCATCG ATTTCCTAGA AAATCGGCCT GAAGAAAGAT TTAATTTTAG 1320 

20 TCCAATCCAG CCATATAAAC AGCCTATAAT TCCCGAGC 1358 

(2) INFORMATION FOR SEQ ID NO: 341: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4557 base pairs 
25 (B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

30 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 341: 
TAGAAGAATT GGAGAAAATG CTAATTCAAT TGTCAACATT CCATAGTTAT CATGATTTAG 60 
AGTTTCTATT TGTGACACGT GAAGATGAAG TTGAAACATT GAAATGGGCA CGTTGGTTGC 120 

35 

CACATATGAC ATTGAGAnGG CAAAACATTA GAGGATTTGT TTACAATCAA CGAACGCGTG 180 
ACCAAATTTT AACGTCAATT TATAGCATGA TTAAAGAACG TATCCAAGCT GTGCtGaACG 240 

40 CAGCAGAAGT AATGAGCAAA TTATTTTCAC ACCGCAATTA GTGTTTGTCA TTACAGATAT 300 

GTCATTAATT ATTGATCATG TCATTTTAGA ATATGTAAAC CAAGATTTAT CAGAATATGG 360 
TATTTCATTA ATCTTTGTTG AAGATGtGAT TGaAAGTTTG CCAGAGCATG TAGATACCAT 420 

45 TATTGATATC AAGTCTCGTA CTGAAGGCGA ACTGATTACG AAAGAAAAAG AATTAGTTCA 480 

ATTGAAATTT ACACCTGAAA ATATTGrTAA CGTCGATAAA GAATATATCG CGCGACGTTT 540 
GGCGAATTTG ATACACGTCG AACATTTGAA AAATGCAATT CCTGATAGTA TTACATTTTT 600 

50 

AGAGATGTAT AACGTGAAAG AAGTAGATCA GCTTGATGTG GTTAATCGAT GGAGACAAAA 660 
CGAAACATAC AAAACGATGG CAGTACCTTT AGGTGTAAGA GGTAAAGATG ATATTTTATC 720 
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AGGGAAATCT GAGATTATCC AATCATACAT TTTATCTTTA GCTATTAATT TTCACCCTCA 840 

TGAAGTTGCA TTCCTATTGA TTGACTATAA AGGTGGGGGT ATGGCGAACT TATTTAAAGA 900 

TTTAGTCCAT TTAGTTGGTA CGATTACAAA CTTAGATGGC GATGAAGCGA TGCGTGCCTT 960 

AACATCAATC AAAGCCGAAT TGAGAAAACG TCAACGTTTA TTCGGAGAGC ATGATGTTAA 1020 

CCATATTAAT CAATACCATA AGTTATTTAA AGAAGGTATT GCGACAGAAC CAATGCCACA 1080 

TTTATTCATT ATTTCCGATG AGTTTGCCGA ATTAAAATCA GAACAACCTG ATTTTATGAA 1140 

AGAACTTGTA TCAACGGCAC GTATTGGACG TTCGTTAGGT ATTCATTTAA TACTTGCGAC 1200 

ACAAAAACCA TCGGGTGTTG TTGaTGACCA AATTTGGTCT AACTCTAAAT TTAAGTTGGC 1260 

ATTAAAAGTA CAAGATAGAC AAGACAGTAA TGAAATTTTA AAAACACCAG ATGCAGCAGA 1320 

CATTACmTTA CCaGgTCGTG CGTATTTACA AGTTGGTAaT AATGAmATTT ATGAATTATt 1380 

20 CCAATCTGCA TGGAGTGGTG CAACATATGA CATCGAAGGC GATAAATTAG AAGTTGAAGA 144 0 

TAAGACGATT TACATGATTA ATGACTATGG TCAACTTCAA GCAATCAACA AAGACTTGAG 1500 

TGGACTTGAA GATGAAGAAA CGAAAGAAAA TCAAACTGAG TTAGAAGCGG TCATAGATCA 156 0 

25 TATCGAATCT ATTACAACAC GATTAGAAAT CGAAGAAGTT AAGCGTCCAT GGCTACCACC 1620 

ATTGCCAGAA AATGTATATC ArGAAGATTT AGTAGAAACa GATTTCAGAA AATTATGGTC 1680 

AGATGATGCA AAAGAAGTGG AATTAACATT AGGACTTAAA GACGTACCAG AAGAACAATA 174 0 

TCAAGGACCG ATGGTATTGC AATTGAAAAA AGCTGGGCAC ATCGCGTTAA TCGGAAGTCC 1800 

AGGATATGGT AGAACAACGT TCTTACACAA CATTATTTTC GATGTTGCAA GACACCATCG 186 0 

TCCTGATCAA GCACACATGT ACTTGTTCGA TTTCGGTACC AATGGTTTGA TGCCAGTTAC 1920 

AGACATACCA CATGTCGCTG ATTACTTTAC AGTAGATCAA GAAGACAAGA TTGCTAAGGG 1980 

GATACGTATA TTTAATGATG AAATTGATCG TCGTAAGAAG ATTTTAAGTC AGTATCGTGT 2040 

CACTAGTATT TCTGAATATC GAAAATTAAC TGGTGAAACA ATTCCGCATG TCTTTATTCT 2100 

TATTGATAAC TTTGACGCAG TAAAAGATTC ACCTTTCCAA GAAGTTTTTG AAAATATGAT 2160 

GATTAAAATG ACGCGTGAAG GGCTAGCATT AGACATGCAA GTAACCTTAA CTGCTTCAAG 2220 

AGCTAACGCT ATGAAAACAC CAATGTACAT TAATATGAAA ACGCGTATCG CAATGTTTTT 2280 

ATATGATAAA TCAGAGGTGT CGAACGTAGT AGGACAGCAA AAATTTGCGG TTAAAGATGT 2340 

TGTGGGTCGA GCATTGTTAA GTAGTGATGA CAACGTATCA TTCCATATTG GCCAACCATT 2400 

TAAACATGAT GAGACCAAAT CATATAATGA TCAAATTAAT GATGAAGTAT CGGCGATGAC 2460 

AGAATTTTAT AAAGGTGAAc ACCAAATGAT ATtCCTATGA TGCCAGATGA AATTAAATAT 2520 
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GGATTAGATT ATGAAGGTGT TACACTACAA AAAATTAAAT TAACTGAACC AGCAATGATT 2640 

TCATCAGAAA ATCCGAGAGA AATTGCGCAT ATTGCTGAAA TTATGATGAA AGAAATTGAC 2700 

ATATTAAATG AAAAATATGC GATTTGTATC GCAGACTCAA GTGGAGAGTT TAAAGCTTAT 2760 

AGGCATCAAG TGGCTAACTT TGCCGAAGAA AGAGAAGACA TTAAAGCGAT TCATCAACTA 2820 

ATGATTGAAG ACTTAAAGCA AAGAGAAATG GACGGCCCAT TTGAAAAAGA TTCACTTTAT 2880 

ATTATCAATG ATTTTAAAAC ATTTATTGAT TGCACGTATA TTCCGGAAGA TGATGTTAAA 294 0 

AAGCTTATTA CAAAAGGACC AGAACTTGGC TTGAACATTT TATTTGTCGG CATTCATAAA 3000 

GAATTAAtAG ATGCTTATGA TAAACAGATT GATGTTGCAC GTAAAATGAT TAACCAATTT 3060 
AGTATAGGTA TTCGTATTTC AGACCAACAA TTCTTTAAAT TTAGATTTAT TCAACGAGAA . 3120 

CCTGTTATTA AAGAAAATGA AGCATATATG GTCGCAAACC AAGCTTATCA AAAGATTAGA 3180 

20 TGGTTTAAAT AGCAATGAAT TAAATAGGAG GGAGGTATGT TATGAATTTT AATGATATTG 324 0 

AAACAATGGT TAAGTCGAAA TTTAAAGATA TTAAAAAGCA TGCTGAAGAG ATTGCGCATG 3300 

AAATTGAAGT TCGTTCTGGA TATTTAAGAA AAGCTGAACA ATATAAGCGA TTAGAATTTA 3 360 

25 ATTTGAGTTT TGCACTAGAT GATATTGAAA GCACAGCAAA GGACGTACAA ACTGCAAAAT 3420 

CTAGTGCTAA TAAGGACAGT GTAACTGTTA AGGGAAAGGC GCCCAATACG TTATATATTG 3480 

AAAAAAGAAA TTTGATGAAA CAAAAGCTTG AAATGTTGGG TGAAGATATC GATAAAAATA 3540 

AAGAATCCCT CCAAAAAGCT AAGGAAATTG CTGGCGAAAA GGCAAGTGAA TATTTTAATA 3600 

AAGCAATGAA TTAATATTGA GGTGAAGATA TGGGTGGATA TAAAGGTATT AAAGCAGATG 3660 

GTGGCAAGGT TGATCAAGCG AAACAATTAG CGGCAAAAAC AGCTAAAGAT ATTGAAGCAT 3720 

GTCAAAAGCA AACGCAACAG CTCGCTGAGT ATATCGAAGG TAGTGATTGG GAAGGACAGT 3780 

TCGCCAATAA GGTGAAAGAT GTGTTACTCA TTATGGCAAA GTTTCAAGAA GAATTAGTAC 3840 

AACCGATGGC TGACCATCAA AAAGCAATTG ATAACTTAAG TCAAAATCTA GCGAAATACG 3900 

ATACATTATC AATTAAGCAA GGGCTTGATA GGGTGAACCC ATGATGAAAG ATGTTAAGCG 3960 

AATAGATTAT TTTTCTTACG AAGAATTAAC AATTTTAGGT GGTAGTAAAT TGCCTCTCGT 4020 

45 AAATTTTGAA TTGTTTGATC CATCAAATTT TGAAGAAGCT AAAGCTGCTT TAATTGAAAA 4080 

GGAATTAGTA ACAGAGAATG ACAAGTTAAC TGATGCAGGT TTTAAAGTGG CTACATTAGT 414 0 

CAGAGAGTAT ATTAGCGCCA TTGTAAATAT TCGAATTAAT GATATGTATT TTGCACCATT 4200 

TAGCTATGAA AAAGATGAAT ATATTTTGTT AAGCCGGTTT AAAAATAATG GGTTTCAAAT 426 0 

ACGAATTATC AATAAAGACA TTGCATGGTG GTCGATTGTA CAATCATATC CTTTATTGAT 4 320 
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CTTAAATAAT GAAAGTATCG ATACGATTGG GCGTGTTTTA GAAATTGAAA TATACAATCA 4440 
TCAAGGTGAC CCTCAACAAA GTTTATATAA CATTTATGAA CAAAATGATT TGTTATTCAT 4500 
TCGATACCCA TTAAAAGATA AAGTGCTGAA TGTTCATATT GGTGTCATTA ATACATT 4557 
(2) INFORMATION FOR SEQ ID NO: 342: 
(i) SEQUENCE CHARACTERISTICS: 

10 (A) LENGTH: 3931 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 

15 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 342: 

TTGAGTGACT TTATTGAAGC GCGTGTAGAA GAAATATTCT TCGAAGTATT TGATGTTTTA 60 

20 CAAGATTTAG GATTAACAAA AGTAAATGGT GGGTTTATTG TAACTGGTGG ATCTGCAAAC 120 

TTACTTGGCG TAAAAGAATT ATTATCAGAT ATGGTAAGTG AAAAAGTTAG AATTCACACG 180 

CCATCACAAA TGGGAATTAG AAAACCTGAA TTTTCTTCAG CAATTTCTAC AATTTCTAGT 240 

25 AGTATCGCTT TTGATGAGTT ATTAGATTAT GTTACAATTA ATTATCATGa TAATGAAGAA 300 

ACTGAAGAAG ATGTTATTGA TGTGAAAGAC AAAGATAACG AATCTAAATT AGGCGGaTTT 360 

GaTTGGTTTA AACGTAAAAC AAACAAAAAA GATACTCATG aAAATGAAGT AGAGTCAACA 420 

30 

GATGAAGAAA TTTATCAATC AGAAGATAAT CATCAGGAAC ATAAACAGAA TCATGaACAT 480 

GTTCAAGACA AAGATAAAGA TAAAGAAGAA AGTAAATTCA AAAAACTAAT GAAATCTCTA 540 

TTTGAATGAT TATTGGCCAA TAAAACTAGG AGGAAATTTA AATGTTAGAA TTTGAACAAG 600 

35 

GATTTAATCA TTTAGCGACT TTAAAGGTCA TTGGTGTAGG TGGTGGCGGT AACAACGCCG 660 

TAAACCGAAT GATTGACCAC GGAATGAATA ATGTTGAATT TATCGCTATC AACACAGACG 720 

40 GTCAAGCTTT AAACTTATCT AAAGCTGAAT CTAAAATCCA AATCGGTGAA AAATTAACAC 780 

GTGGTTTAGG AGCAGGAGCT AATCCTGAAA TCGGTAAAAA AGCTGCAGAG GAATCTCGTG 840 

AACAAATTGA AGATGCAATC CAAGGTGCAG ACATGGTATT TGTTACTTCT GGTATGGGTG 900 

45 GCGGAACTGG TACTGGTGCA GCACCAGTCG TTGCTAAAAT TGCAAAAGAA ATGGGCGCAT 960 

TAACTGTTGG TGTTGTAACT CGTCCATTTA GTTTTGAAGG ACGTAAACGT CAAACTCAAG 1020 

CTGCTGCTGG AGTAGAAGCT ATGAAAGCTG CAGTAGATAC ATTAATCGTT ATACCAAATG 1080 

SO 

ACCGTTTATT AGATATCGTT GACAAATCTA CGCCAATGAT GGAAGCATTT AAAGAAGCTG 1140 

ACAACGTGTT ACGCCAAGGT GTACAAGGTA TCTCAGACTT AATCGCTGTT TCTGGTGAAG 1200 
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GTATTGGTGT TTCTTCTGGT GAAAATAGAG CGGTAGAAGC TGCTAAAAAA GCAATCTCTT 1320 

CTCCATTACT TGAAACATCT ATCGTTGGTG CACAAGGTGT GCTTATGAAT ATTACTGGTG 1380 

GCGAGTCATT GTCATTATTT GAAGCACAAG AGGCTGCTGA TATTGTCCAA GATGCTGCAG 1440 

ATGAAGACGT TAATATGATT TTCGGTACAG TTATTAATCC TGAATTACAA GATGAGATTG 1500 

TTGTAACAGT TATTGCAACT GGTTTTGATG ACAAACCAAC ATCACATGGT CGTAAATCTG 1560 

GTAGCACTGG ATTCGGAACA AGCGTAAATA CTTCTAGCAA TGCAACTTCT AAAGATGAAT 1620 

CATTCACTTC AAATTCATCA AATGCACAAG CAACTGATAG TGTAAGTGAA AGAACACATA 1680 
CAACTAAAGA AGATGATATT CCTAGCTTCA TTAGAAATAG AGAAGAAAGA CGTTCAAGAA , 1740 

GAACAAGACG TTAATCGGTT AATATATATA CACAAATAAT TCAACACAAA TCATCAGATA 1800 

ACATATCTGA TGATTTTTTT ACTAATTTTT AGaACATGTA GAAGGACATT TAAGTTTTTC 1860 

aAAGTTATTA AAAGTGTTTA AGTATCGTGT GAAAATTAAG TCaAAAATTA TTTGCGCAAC 1920 

ATTTTAACTT TAAACATAAA TGTTATATTA TATAATTATT AACTTTGTAC AGTTAGACGA 1980 

AGATAATTTA AATGAAATGA TGGTGACGAT CGAGTGAATG ATAATTTTAA AAAGCAACCG 2040 

25 CATCATTTAA TATATGAAGA GTTATTACAA CAAGGTATTA CTCTAGGTAT TACAACTAGA 2100 

GGAGATGGTT TAAGTGACTA TCCTAAAAAT GCTTTTAATA TGGCGAGATA TATTGATGAT 2160 

CGCCCATATA ATATTACTCA ACATCAATTG CAATTAGCTG AAGAAATTGC GTTTGATAGA 2220 

AAAAATTGGG TGTTTCCCAT TCAAACACAT GAAAATAAAG TCGCTTGTAT TACAAAGGAT 2280 

GATATAGGCA CAAATATAGA CACTTTAACT GATGCGCTTC ATGGTATTGA TGCGATGTAC 2340 

ACATATGATA GTAATGTCTT ATTAACGATG TGTTATGCAG ACTGTGTACC AGTATATTTT 2400 

TATAGTACAA AACATCATTT TATTGCATTG GCGCATGCAG GTTGGCGTGG TACCTATACT 2460 

GAAATTGTAA AAGAAGTGCT AAAACATGTG AACTTTGATT TGAAAGACTT ACATGTCGTT 2520 

ATTGGACCAT CTACATCATC AAGTTATGAA ATTAATGATG ATATTAAAAA TAAATTTGAA 2580 

ACATTGCCAA TTGATAGTGC CAACTATATT GAAACTAGAG GACGAGATCG TCATGGTATT 2640 

GATTTGAAAA AAGCCAATGC TGCATTATTA ATTTATTATG GTGTTCCTAA AGAAAATATT 2700 

45 TATACGACAG CGTATGCTAC ATCTGAACAT TTAGAATTAT TTTTCTCTTA TCGATTAGAA 2760 

AAAGGTCAAA CAGGACGCAT GTTAGCATTC ATTGGTCAAC AGTAAACAAG GAGGAGATAT 2820 

GTTTGCGTGT GAAAGATAAT TTACAACAAA TCTCAACACA AATTAATGAC AAAAGTGAAA 2880 

50 AAAATAATTT TTCAACAAAA CCAAACGTGA TTGCAGTTAC AAAATATGTT ACAATAGAGC 2940 

GAGCTAAAGA AGCGTATGAG GCTGGAATAA GACATTTTGG TGAGAATAGA TTGGAAGGCT 3000 
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AATCTCGAAA AGTTAAGGAC GTTATAAACG ACGTAGATTA TTTCCATGCT TTAGATCGAT 3120 

TGAGCTTAGC CAAAGAAATT AACAAACGTG CAGAACATAA AATTAAATGT TTCTTGCAAG 3180 

TGAACGTTTC GGGAGAAGCT TCTAAACATG GTATTGCTTT AGAAGATGTT GATCAGTTTA 3240 

TAGATGATCT TAAAAAATAT GACAAAATCG AAATTGTAGG TTTAATGACG ATGGCACCAT 3300 

TGACAGATGA TGAAGCATAT ATTAGATCGT TATTTAAACA GTTACGTTTG AAAAAAGAAG 3360 

AAATACAACG ACTCAATTTA GAATATGCGC CTTGTGATGA ATTATCAATG GGAATGAGTA 3420 

ATGACTATCT TATTGCAGTT GAAGAAGGTG CGACGTTTGT TAGAATTGGG ACTAAACTTG 3480 

TAGGAGAAGA GGAGTGAGCC ACTTGGCTTT AAAAGATTTA TTTAGTGGAT TTTTTGTAAT 354 0 

AGATGATGAA GAGGAAGTAG AAGTACCTGA CAAACAACAA CAGGTAAATG AAGCGCCAGC 3600 

AAAAGAGCAG TCACAACAAA CAACAAAACA AAACGCAATC AAATGAGTCC CTCAAAAATC 3660 

TGCATCAAGA TATACAACAA CGTCAGAAGA AAGGAATAAC CGTATGTCTA ATTATTCAAA 3720 

AAATAATTCA CGTAATGTTG TAACTATGAA CAATGCTACA CCAAACAATG CATCACAAGA 3780 

AAGTTCAAAA ATGTGTTTAr TCGAACCACG TGTTTTTTCA GATACACAAG ATATTGCTGA 384 0 

TGAGCTTAAA AACCGCCGTG CGACACTTGT CAATTTACAA CGTaTTGATA AAGTATCAGC 3900 

GAAAAGAATT ATTGATTTTT TAAGCGGTAC T * 3931 

(2) INFORMATION FOR SEQ ID NO: 343: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3150. base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 343: 

40 AATTGTCGGG GGACTCTTAG GTTTTGTCAT GCAAAGAACA AGATTTTGTT TAACAGGTGG 60 

CTTTCGAGAT ATGTATGTGC AAAAGAATAA TAAGATGTTC TATGCATTAT TAATCGCTAT 120 

TACTATTCAA AGTATAGGAT TATTGATTTT GACGGCAACA GATATTTTAC AAATTCCTGC 180 

45 ACATAGTTTT CCAATATTGG GAACAATTAT AGGTTCTTTT ATTTTTGGAA TTGGAATAGT 24 0 

ATTGGCTGGA GGATGTGCAA CAGGtACTTG GTATCGCGCT GGTGAAGGGC TAATTGGTAG 300 

TTGGATTGCA TTAGTATTAT ATGCTGTTAC TGCAGCAATC ACTAAAACAG GGATTTTAAA 360 

SO 

GCCAGTAATG GATAAAATTA ATCAACCAAC GAATGTAAAT AGTGATATGT CTCAAACAAC 420 

— TGGCATTCCG TTTTGGGGAT TAGTCGTTAT ATTAACTATA ATCACCATTT TTCTAGTTGT 4 80 
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AGGTATTAGA TATTACCTTT TCGAAAAACG ATACCATCCA TTTATTGCAG CAATTGTAAT 600 

TGGACTTATC GCACTCTTAG CTTGGCCAAT GAGTGCATCA ACTGGAAGAA ATGACGGTTT 660 

AGGTATAACA ACGCCTTCAG CAAATTTAGT ACACTTTTTG ATTACAGGTG AAACTAAATT 720 

TATTGATTGG GGTGTCTTTT TAGTTCTAGG AATTTTCATT GGTTCATATA TTGCAGCTAG 780 

AGGATCAAGA GAATTTAAAT GGCGATTGCC AGACAAGATT ACAATACGAA ACAGTGCCAT 84 0 

TGGTGGCATA TGTATGGGAT TTGGTGCGTC AGTTGCTGGT GGTTGTTCTA TCGGTAACGG 900 

TTTGGTTGAA ACGGCAACGA TGACTTGGCA AGGATGGATT GCGCTAgCAT gCGATGATAG 960 

TTGGTGTATG GACAATGAGT CATTTTATCT TTGTTCGTCC AATGAAAAAA GTACACCAAC 1020 

AATCTGCAAA GGTTAAACAG CAAACGCAAA TAGTATAGAA GATTATTATG CAAATGATGT 1080 

TGATCAAATA AAAGTGATTG GAAAAGGAGA AATAATTATG ATACACGAAT TAGGTACAGT 1140 

20 AGGAATGGTA TGTCCATTTC CGTTAATTGA AGCGCAAAAG AAAATGGCAA CATTGCAATC 1200 

TGGAGATGAA TTAAAAATTG ATTTTGATTG CACGCAAGCG ACGGAAGCCA TTCCAAATTG 1260 

GGCTGCAGAA AATGGTTATC CTGTAACAAA CTATGAACAA ATTGATAATG CTTCATGGAC 1320 

25 AATTACAATT CAAAAAGTTT AACGTTATCA TTTTAACAAT AAAATAGATA TTAGATTCTA 1380 

TGGCTACTTC CGCTAATTTA AAAGTGAGTA AGTAGTCTTT TTTTTTTTAG TTCATGAAAT 1440 

CATTTTTATA TAGTGTGGCA CATTTTATTC CAAAAGATGT AATAAAACTT AACGCATTTT 1500 

TGCTTTTTAT AAATTGTCAG ATTATTATGA AAAAAAGGGA GTGGTAAGTA TGAATCTTAA 1560 

CGATACGATA TTTATGTTTT TGTGTACATT ATTAGTTTGG TTAATGACAC CAGGATTAAG 1620 

TTTATTTTAT GGTGGGTTAG TTCAATCTAA AAATGCGCTT AATACTGTCA TGCAAAGTAT 1680 

GG CAGCAATT GTGCTTGTTA CATTTGTATG GATAACAGTT GGTTTTACAA TTAGTTTTGG 1740 

GAATGGGAAT TTATGGTTCG GAAATTGGGA ATATACTTTT CTTAATCATG TAGGTTTTGC 1800 

40 GACTCAAGAA GATATTAGCC CACATATTCC TTTCGCTTTG TTTATGTTAT TTCAAATGAT 1860 

GTTTTGTACG ATTGCAATTT CTATTTTATC TGGTTCAATC GCTGAGAAAA TGAAGTTTAT 1920 

TCCTTATTTA TTATTCGTAG TAATATGGAC TGCTCTTGTA TACAGTCCAG TAGCACATTG 1980 

GGTTTGGGGC GGCGGTTGGA TTAACAAACT CGGTGTATTA GATTTCGCTG GAGGTACGGT 204 0 

TGTTCATATT ACATCAGGTG TTTCTGGTTT AGTATTAGCT ATTATGATTG GAAAAGGAAA 2100 

CAAACATTCT GAATCAACAC CACATAATCT TATCATrACG TTGATTGGCG GTATATTCGT 2160 

GTGGATTGGT TGGTATGGAT TTAATGTAGG TAGTGCTTTT ACATTTGATA ATATTGCGAT 2220 

GCTTGCATTT ACAAATACTG TCATTTCAGC CAGTGCAGGT GCTATAGGTT GGTTAATTTT 2280 
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ATTAGTTGTC ATTACTCCTG CAGCAGGATA TGTAACATAT CTTAGTGCAA CAATAATGGC 2400 

TTTAATAGGA GGTATCTGTT GTTATATTGT CATTAATTAC ATCAAGGTAA AACTAAAATA 2460 

TCATGATGCA TTAGATGCAT TTGGTATTCA TGGTGTTGGT GGTATTATTG GTGCTGTTTT 2520 

AACAGCAGTT TTCCAAAGTA AAAAAGCCAA TCCTGACATT GAGAATGGCT TTATTTATAC 2580 

TGGTGACATA CATATTATAC TTGTACAAAT ATTATGTGTA ACAGCAGTTG TAATTTTTAG 2640 

TATAGTCATG ACGTTTATTA TTGCGAAAGT AATTAAATTa ATTACACCAT TATCTGTTAC 2700 

GGAACAAGAA ACGAATATAG GATTAGACAA GATTGTTCaC GGTGAACATG CTTACTTTGA 2760 

,5 AGGTGAGCTA AATAGATTCA AT AAA CAT AT TCGATATTAG AATATATTTA CATAGAATAT 2820 

TCATTGTCCT GACATTTAAC TAAAGGTTGA TGTTGGGACA TTTTGTTATA CAAAAGTTTT 2880 

ATTTTGAAAT CTTTTTATGA AAGAAGCAGA AATATTATTT AAAGCGGTTA CACATATGCT 2940 

AAAATAAGGC TAAGTGTCAC AAATAATGAT AGGTGAATAA GTATGAAAAA TATATCTGAT 3000 

ATTGCCAAAT TGGCAGGCGT TTCAAAAAGT ACAGTATCTA GATTTTTAAA TAATGGATCT 3060 

GTCAGTAAAA AAACAAGTGA AAAATTAACA AGAATTATAG CAGAACATGA CTATCAACCG 3120 

AATCAATTTG CTCAAAGTTT AAGAGCGAGA 3150 
(2) INFORMATION FOR SEQ ID NO: 344: 
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<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3719 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 344: 

GTTATAGTGA AATTGACTCA TCACATTTCA CAGACCGTGA CAAACGCGTT ATTAGACGTG 60 

ATCATGTTAA AGAAGCACAA AGCTTAGTAG AGAACTATAA AGATACACAA AGTGCTGATG 120 

CTAGGATGAA AGCCAAACAA AAAGTTAACA CATTAAGCAA ACCGCATCAA AACTATTTCA 180 

ATAAACAAAT TGATAAGGTT TATAATGGAT TACAACGCTA ATCCAAAGTA AATTATAAGT 240 

TATACATCTC GTTTTTAAAT GACAATTTAT CCCCGTAAAT ATTATAAATA ATCTTTTCAA 300 

ATTCCACATA GATATAGAGA CACTAATAAA CCTCTTTGTC TCGATATGAT AGTCTGCAAC 360 

GATTCATGTT GTAGGCTTTT TAATTTTACA AATAAGGCTA AATATATAAG TTCTGGCACC 420 

TAAAATATAG AAAATACATA AAAGTAAGTA TAGTTATTTT ATTATAATTA TTAAATTTTT 480 

ATTAATTAAT TGTAAAAATG TATAATTATA ATTAATTAAC GTTTAATATT AAAATTAACT 54 0 
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ATCGTTTCAA TATTACTTAT AGGGATGGCT ATCAGTAATG TTTCGAAAGG GCAATACGCA 660 

AAGAGGTTTT TCTATTTCGC TACTAGTTGT TTAGTGTTAa CTTTAGTTGT AGTTTCAAGT 720 

5 

CTAAGTAGCT CAGCAAATGC ATCACAAACA GATAATGGCG TAAATAGAAG TGGTTCTGAA 780 

GATCCAACAG TATATAGTGC AcTTnCAACT AAAAAATTAC ATAAAGAACC TGCGACATTA B40 

ATTAAAGCGA TTGATGGTGA TACGGTTAAA TTAATGTACA AAGGTCAACC AATGACATTC 900 

10 

AGACTATTAT TGGTTGATAC ACCTGAAACA AAGCATCCTA AAAAAGGTGT AGAGAAATAT 960 

GGTCCTGAAG CAAGTGCATT TACGAAAAAA ATGGTAGAAA ATGCAAAGAA AATTGAAGTC 1020 

75 GAGTTTGACA AAGGTCAAAG AACTGATAAA TATGGACGTG GCTTAGCGTA TATTTATGCT 1080 

GATGGAAAAA TGGTAAACGA AGCTTTAGTT CGTCAAGGCT TGGCTAAAGT TGCTTATGTT 1140 

TATAAACCTA ACAATACACA TGAACAACTT TTAAGAAAAA GTGAAGCACA AGCAAAAAAA 1200 

20 GAGAAATTAA ATATTTGGAG CGAAGACAAC GCTGATTCAG GTCAATAATG CTCATTGTAA 1260 

AAGTGTCACT GCTGCTAGTG GCACTTTTAT AATTTTTAGA TCACGATATG ATTTATTATC 1320 

AATTCAGAAT TAAAAAAGTA AATAGTATCA AAAGTAAGTG TATTTAATAT TAGAAAATAA 1380 

25 

AAATTTTAAA TTTAGTATTA AAATGGAATG TTACTATATA GTTCAATGTG TATTATCACA 144 0 

GAAAATAAAA TAATGCTTTA CTTCTATATT TAAAAGTGTA TAATGAAAGT TAAGTAATAA 1500 

AGAGCGTGAA GAAAAATGTG AGTTATTTAT ATAGAATATT CTCCTTTTCA TTTATGAATT 1560 

30 

TGTTACAAAA TATTTAGTGC AAAAGCACGA cGGAGGTATT CAATATGaAT AACGGTACAG 1620 

TTAAATGGTT TAATGCAGAA AAAGGTTTTG GTTTCATCGa AAGAGAAGAT GGTAGCGACG 1680 

3£ TATTCgTACA CTTCtCAGCA ATCGCTGAAG ATGGATACAA ATCATTAGAA GAAGGCCAAA 174 0 

AAGTTGAATT CGACATCGTT GAAGGCGACC GTGGCGAGCA AGCTGCAAAC GTAGTTAAAA 1800 

TGTAATTTTA ACTTATTCAA ACAGTCCTTA CTATAGGGCT GTTnTTTAT GCTTTAAATC 1860 

40 GATAACAGTT GGTGTGGTAA AAGCACTAGC CGTTATTTTT TTGTCCAATA AATTTAGTTG 1920 

GAGATTTAAC AATATATAAT GGTTCTAAAA TAAATCGAAC TGATGGAAAA GTTTTTTACT 1980 

TTTCATCTGT CCGACTTTTG ATTTTGAATA TAAAAAAGCG CCAATACAGA ACTTTAATAA 2040 

45 

TGACGAGAAT TAAAGTCTGT ATATGGCGAT AACAAGAAGT AATGTTAAAC ACTCAAAATG 2100 

TTTAACAATA ATAGGATACC ACATCGCATA ATATCTTACT ACTTAATTAA TAATTTAACT 2160 

AATCAACTTT TTGTTAATTT TTTATTAAGA CTGATTAATT ATTGAGAATA TTTATTGTTT 2220 

SO 

TTAAAATCTC ATAATAATTC AGTAATCTTG TTTTCATTTA AAAGGCGAAA CATTAAAATA 2280 

ATTAAATAAA AATATTGCGT TTAATTTACA GCGTCAAATA TACTTATTTC TAATGCTTTG 234 0 
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ATTTCTGTGA GTATTTGGAA GCTACCATTA GGCAACGGTT TAACAATAGA CAATTGCTTT 2460 

TCCGCTTGTT GTATTAAAAA AGGTTTTGTA GATTGATTAT TAATATGCCA TTCACTCATG 2520 

5 TATGTTTTTC ACTCCTGCTT TAAAATAGGG TTAGAAAGTT TATAGTTGAG ACATTCATGT 2580 

TCAACCAAAA TTTTGTTCGA ATTCAATAAA TGTCTTGTTT AAAATAGAAA TATTGTAAAT 2640 

GTTATCGTCC AAAACTTCAC CAGTTAAGTA TTTGTTTTGA ATTAAAATTT GGCAGTTAGT 2700 

10 

TAAGAAGTCT TGATAATCAC GATCGCAAAA ATAGTTTTCA CGTGCATCTT TAGCATCGCC 2760 

AAAAAAGTTA GCGACTGTTT CTGTTTCTCC TTTATTCGAA CGTTCAATAT ATAATTTGTA 2820 

AAATTTAGCT ATTGTATACT TTTGTTCTTT AGTTAGTTCA TTCAAAATAT TGGGCCTCCT 2880 

15 

GAAATATCAT TTGTAATCTA TACCCAATTT ATTGCAAAAC AAAAACTAAT TTAACTATTT 294 0 

GATGAAACTG TGTTAATAAg CTTTAACAAG CCTTAGTTTG TATGGATCTA TAAAATTATC 3000 

20 TTTAATTGCA TAGGGTGAAA TAATATGTAG TCCATAACXT TTAACTGATT TTTCACTTAC 3060 

ACCAAATTTA TAAGCTTGGT AGATAATTTT AGTACAATAC GTAAATTTTT TGCTGTTCAA 3120 

ATTTAATGTA ACTAGATAAC GATGATTTGT ATTCTCATAG TTTTTCTTAA CCCATTCAGC 3180 

25 CGCTTTTTTA CCTGCACCAG GATAGCTGCA ACGATAAACT TTCATCCAAT CATTTTTGCC 324 0 

ACTTGCATAA TTATATTTAA AAGATTCGAA GGATTGTGTA GTTGGTTTGT CGCCAGGCCC 3300 

CTCAATTTGT AAAATCGTTT TATCATCAAT CGCGATACTA CAATGACCAA AAAATCscCA 3360 

30 

CATGACAGGG CCTTTTGTAA CAATAATATC ACCAGGTTGT AATTGGAATT TGTCATCTTG 3420 

AATTTCTGAA TACTTATTAT CTGCAATTGT TTTTGGTGAG TTTATTGGGG ATACGACAAC 3480 

GAATAATATA AGTAAAATTA TCGTTCGTTT AATATAGTTC ACTTAAAAGC TCCTTGTTGA 3540 

35 

AGAAATATAT GTAAATAGTC TTAAATTAGA ATTGTAATCT TTAATAAGCT TGtAAGACTA 3600 

AAACATATCT TAAATATTAA AGTATGAGAG TGTGAAATGT CTATTAAGAA TnAAAAACAG 3660 

TCTGAAACAT CATTGAGACG TTCCAGACTG GATATAAAAT GAATTTCATT TATAGCACA 3719 

40 

(2) INFORMATION FOR SEQ ID NO: 345: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1676 base pairs 
45 (b) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

50 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 345: 
TTGCGTTGCC GCACCAAGAT ATTGAATGCC TAGCGATTCC GAGTATGCAA ACTGAACGCA 60 
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CTCTTTAATA CGCGTTATCG CTTTTTGTAA ATCTGCATCA TGATAACAAA TCATAACGCC 180 

ATAGCCACCT GCTGTCGGAA GATCATCTCC CGGCTTAATT ACTAACGGGA ATTCCCAATT 240 

5 CTTAATCTCG TTTTCGAATT GCTCAATTTT TACAACTTTT CTTTTTGGTA AAAACTTCCC 300 

ATTTGTCCAT TCAGGTATTC TTGCTTTATT ATTTAAAGGA ACAAATAACG TTTTATCTAA 360 

TGCATAATAT TGCTGATTCA AGATTGTTTC ATCATGAATA TATTGAAAAT AAATCTTTTT 420 

10 

ATTTTCCTTA TGTGCCAATT GTTTGATCAA GTTTTCGTAA GATTGCTGAT TGTTAAATGT 480 

ATAAATTGAG TTCGGtACTT CCTTACCAAT AACTTGAAAT AGCTGATGCA ATTTGTCTGT 540 

15 CGCACTAGCT TCGTGAACAA TAACAGGTAA TTGATTTGCT ATTAATAACT CCCTACCAGT 600 

TAAAAAATTA GATTGATGTT CGTCCGGTTT CAACCATGGA TTCGATATAT ACGAAGGTCT 660 

TGACGTATAG ACAACATCTT TGTCATATAA ATCACTTAAC GTTAAGTTCG GCTCATTACC 720 

20 ATTATTTGTC ATTACTTCCC ATTCCCTTTC AAATGCGCAT GCTCTTCAAT AATGTCTTGA 780 

TAAACGTCTT GATTTGTAAT TAACTCTAAC CCCATCAACG CCATTATTTT AGCGCCTTTA 840 

ATTAATGCTT CATCACCATG TACACTCGCA GCCGCTTCTC TAAATCTATG CGTATGTCCT 900 

25 

ACTAAATTAC GTGATCCTAT TTTAATATGA GGATGTATTG TTGGCACAaC ATgaCTTACG 960 

TTCCCTGTAT CCGTAGAGCC ATAACCAAAA TCATCATCAA TAACTGCTTC ACCAACTTCT 1020 

TCAGCATATT TAGCAAATAA ATCATCTAAT TTCGGCGTTT TAATGAATTC ATTCACACCG 1080 

30 

TTTTGAATTC GACCAAATTC ATAATCACAA CCAGTCTGTA TCGCAGCTCC ACGTGCGATT 114 0 

TGATTTACTT TTTCTGTTAA TATATCCAAT TCTTTACGCG TCATTGCTCT AGTATAAAAA 1200 

35 CGAGCATGTG TATAGTCTGG AATAATATTA GCTGCTTTCC CGCCATCTAA AATCACACCA 1260 

TGCACACGTT GATCTTTTTT AATATGTTGT CGTAGTTGTG CTACACCATT AAAATAACTA 1320 

ATCATAGCGT CTAATGCATT TAACGCTTCA TCTGCATTTT CAGAGGCATG AGCACTTTTT 13 80 

40 

CCGTAAAATT TAACATCTAA AACATCCACT GCCAAAGTAT CAATCGTTTT ATAAGTTTCA 1440 

TTTCCCGGAT GAATCATTAA GGCAATGTCT ATTTGATCAA TCACACCAGC CTTGACATAA 1500 

GAAGCTTTAG CGCTACCATT TTCCCCACCT TCTTCAGCTG GACATCCAAG AACGACTACT 1560 

45 

TTACCACCAA TTTGGTCAAT CACTTGCTTC AAACCAATTG CACCAAGAAC ACTTGCAGTT 1620 

CCAATGATAT TATGACCACA AGCATGACCC AATCCTGGCA AAGCATCGTA TTCTGC 1676 
50 (2) INFORMATION FOR* SEQ ID NO: 346: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1294 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 
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(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 346: 
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TACAGTAGGA 


ATCATAAAAC 


CTAATACAAC 


AAATACAAAA 


CCATTTAAGG 


CATAACTAAA 


60 


TGTGTTCCAA ATTTGATGGT 


AATTCATTTG 


TAGTTCCGTT 


TGTGCTCTAA 


TTAAACGGTC 


120 


« pfjTTCT AAA 


CCATGGATTA 


GACCTGCGAT 


TACAACTGCA 


ATGATACCTG 


AAG CATG AAC 


180 


X 1 L 1 1 v 1 VJv. X 


AAAAAGTATA 


CGACAAAAGG 


AGTTAATAAT 


TGAATAAAAG 


TTAAGGTATT 


240 


Vj X X J\ X V* X X X X 


AAACCTTTAT 

nrirx w w x x x x 


TAGCGGTTAA 


GTCTATACGT 


ATTCTAACGA 


CAACGAATCC 


300 


n tv T7x TlTTYSPTl 


fTAATAAGTA 
v.winJlnnvj X/* 


CACCTAGTAT 


TGTTGAAATG 


ATAAATTGTT 


CAACAGCTTG 


360 


r* 7x 71T71 TlTfSfc & 




TTACTAATGC 


AGTAACAGCA ATTTTAAATG 


AAATGATACC 


420 




TTCl 71 f2T 71 A Afl 


ATTCACCTTC 


TAAAATCGTC 


ATAGAACCTT 


TAGGTAATAA 


4B0 


11X1 ^l»V,?V_V? 1 




ATACTGCTAC 


TGCATCAGTA 


GGACATAAAA 


TTGCTGCTAT 


540 


TV* P 7x 71 71 71 fZCCZ 


G PTGG C ATTG 


GTAAGGCAGG 


CCAAATCCAA 


TGTATAAAAT 


AGCCAACACC 


600 


P A PT 71 P 71 f2TT 


uLnnn^nL xn 


GTGCCATTGA 


CATTAATAGT 


ATAGGTTTAC 


GATATTCTAA 


660 


T 71 71H™ 1 ""nWTT 
l/v\l X X Xx? X X 


CGAGAGACGT 


GGGTACCTTC 


CACAAAAAGT AGTGGCGCGA 


TAACGGCAAA 


720 


CATAAATACT 


TCAGAATTGA 


ATTGGAAATC 


AACTTGTATT 


GGAATAATGA 


AAATAACGAC 


780 


ACCTAATGCA 


ATTTGAATAA 


AGGCAGTAGG 


AATTTGTGGG 


AATCGATTAT 


TGATAACCGA 


840 


ACTAATAATC 


ACAGCAAAAA 


TAAAAATTAA 


AAATGCTTCT 


AATAGTGCCA 


TACAATACTC 


900 


CTCAAAATTT 


TAATAGTTAA 


TATTTTATCA 


CTTTTAAGGC 


ATAATGACAT 


AGATATATTG 


960 


ATAAAATGAA 


GTTATTTTCA 


AAAAAACTCT 


AGTATCGGTT 


GAACTGATAC 


TAGAGCGAGA 


1020 


TGTTTAAATT 


ATTGATTGTC 


ATATCTGAAA 


TGACCGCTGT 


CATTTTGTCG 


TTGTTCATAC 


1060 


GCGAGCTTTT 


CAGCATTCGT 


TTTGTATTTT 


TtATAAAAGa 


AAAATAaAAA 


TATnAACCaG 


1140 


AATGGCGAAA 


TATAAATAGC 


TGCTCTTGtT 


TCGTCACTAA AGAATAATAA 


AATGAATACA 


1200 


AAGAAGAAGA 


ACGCTAGAAT 


AATGTAAGCA 


ATAGGCTTAC 


CACCAATCAA 


CTTAAATTTA 


1260 


CTGTTTTTAT 


GTGCCTCAGG 


ATGCTTTTTC 


AAAT 






1294 



(2) INFORMATION FOR SEQ ID NO: 347: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1935 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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ACATGATAAT GATGACGCTA TTAAAACACG TTTTTTATTT TTCATTGTTA TAACCTTCTT €0 

TCGTATGATT GATATTTGTT GATATGTATC GACATGTGAA TAATATCACA AAAACAGAGA 120 

ATATATATTT AACTATTTAT TAAATGATTT TGTTAATATT ATTAAATACT TTATCCTCTT 180 

TAAAAATAAT GTGTGTACAA AGTCATTAAT TTAGCAAATA TTTTTATTTA GTAGTTAATA 240 

ACCATCGATT TGAAATTTAT ATATAATTAT TAGCTAAATA ATATCCTGCA TCTTTCTCAT 300 

ACAATTTACT ATAAAtTAgC ATATCCGATA TCAGCGTTAA TAAGATCGTT GATACTAGmC 360 

AGTTAATTTC ATAGAACGAA ATCAAATAAC ACACTACTTT CTGCATTTTA AATTATGTTT 420 

15 AAGAATCAnA ATTATGTTTA nATAAATATA TATACTACTT TGAAAGGTGT GAGCTTAATG 480 

ACAACTTTTA GTGAAAAAGA AAAAATTCAA TTACTAGCAG ATATTGTTGA ACTACAAACT 540 

GAAAATAATA ATG AAATAG A CGTTTGTAAT TATTTAACAG ATTTATTCGA CAAGTACGAT 600 

20 ATTAAATCTG AAATTTTGAA AGTTAATGAA CACCGCGCCA ATATCGTTGC AGAAATCGGT 660 

AACGGCTCAC CTATACTCGC ATTGAGTGGT CATATGGATG TTGTTGATGC AGGAAATCAA 720 

GATAATTGGT CATATCCCCC TTTTCAACTG ACAGAAAAAG ATGGCAAATT ATATGGCCGA 7B0 

GGCACTACAG ATATGAAAGG CGGTTTAATG GCTTTGGTCG TATCTCTAAT CGAATTAAAA 84 0 

GAACAAAATG AATTGCCTCA TGGAACGATT AGATTACTGG CTACTGCTGG CGAAGAGAAA 900 

GAACAAGAAG GTGCCAAATT ATTAGCTGAT AAAGGCTATT TAGACGATGT CGATGGCTTA 960 

ATTATTGCTG AACCAACTGG ATCTGGAATT TATTATGCAC ATAAGGGGTC TATGTCATGT 1020 

AAAGTAACTG CAACTGGTAA AGCTGTCCAT AGCTCAGTTC CATTTATTGG TGACAATGCA 1080 

35 ATTGATACAC TGCTTGAATT TTATAATCTA TTTAAAGAAA AATATTCAGA GCTTAAACAA 1140 

CAAGATACTA AACATGAATT AGATGTTGCG CCTATGTTCA AATCATTGAT TGGAAAAGAA 1200 

ATTTCTGAAG AGGATGCAAA TTATGCATCT GGTCTTACAG CTGTATGTTC GATTATAAAT 1260 

GGCGGCAAAC AATTTAACTC TGTACCAGAT GAAGCTTCAC TTGAATTTAA CGTAAGACCA 1320 

GTTCCTGAGT ATGATAACGA CTTTATAGAA TCGTTTTTCC AAAATATCAT TAATGATGTG 13 80 

GATAGCAATA AGCTTTCACT CGATATTCCA AGCAATCACC GACCTGTAAC AAGCGATAAA 1440 

AATAGCAAAT TAATTACTAC GATTAAAGAT GTAGCTTCTA GTTATGTAGA ACAAGACGAA 1500 

ATATTTGTTT CAGCGCTTGT AGGCGCAACA GATGCCTCTA GTTTCTTAGG AGATAATAAG 1560 

50 GACAATGTTG ATTTAGCCAT TTTTGGACCA GGTAATCCAT TAATGGCACA TCAAATCGAT 1620 

GAATATATTG AAAAAGATAT GTATCTGAAA TATATTGATA TTTTTAAAGA GGCTTCCATT 1680 

CAATATTTAA AAGAAAAATA AGAACGATGC TGTCAGCTGC CCTATTCGCG TGCTGGCAGT 1740 
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TCAAATATCA ACAAGCACAT TTTCATTGAT TAAGTGATGT AAAACTGAAA TTATTGTGCT 1860 

GATTTGTCAT ACATATATTG ACTAATGGGC ATATAAAAAG ATAGCCTCTA ATAGTnACAT 1920 

AAACTCGTAA AAnCC 1935 



(2) INFORMATION FOR SEQ ID NO: 348: 

(i) SEQUENCE CHARACTERISTICS: 
10 (A) LENGTH: 1351 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

15 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 348: 
CCTTTnCCTA AACAATTTTT AGATTTAGAC AACAAACCGA TTTTAATCCA TACATTAGAA 60 
20 AnATTTATTT TAATTAATGA TTTTGAAAAA ATTATTATCG CGACGCCACn ACAATGGATG 120 

ACGCATACGA AAGATACACT TAGAAAATTC AAAATTTCTG ATGAAAGAAT TGAAGTCATT 180 
CAAGGTGGTA GCGATCGTAA CGATACAATT ATGAATATCG TTAAACATAT TGAATCAACA 240 

25 

AATGGTATTA ACGATGACGA TGTCATTGTG ACACATGATG CAGTTAGACC ATTTTTAACG 300 
CATCGTATTA TTAAAGAAAA TATTCAAGCT GCTTTAGAGT ACGGTGCAGT AGATACAGTG 360 
ATTGATGCTA TAGATACGAT TGTTACATCT AAAGATAATC AAACGATTGA TGCAATTCCA 420 

30 

GtGCGTAATG AAATGTACCA AGGTCAAACA CCTCAATCGT TTAATATTaA TTTATTAAAA 480 
GAaAGCTATG CACAGTTGAG TGATGAGCAA AAGAGTATTT TATCTGATGC TTGTAAGATT 540 
35 ATTGTAGAAA CAAACAAACC GGTTCGACTT GTAAAAGGTG AGTTATATAA CATTAAAGTA 600 

ACAACACCTT ACGATTTAAA AGTAGCGAAT GCTATTATTC GAGGTGGTAT TGCCGATGAT 660 

TAATCAAGTA TATCAATTAG TTGCACCTAG ACAATTTGAA GTTACGTATA ACAACGTAGA " 720 

40 

TATTTACAGT GACTATGTCA TTGTACGTCC TTTATATATG TCAATTTGTG CTGCCGATCA 780 
AAGATATTAT ACTGGTAGCC GTGATGAGAA TGTCTTATCT CAGAAATTGC CAATGTCTTT ' 840 

AATTCATGAA GGTGTTGGTG AGGTCGTATT TGACAGTAAA GGTGTGTTTA ATAAAGGTAC 900 

45 

AAAAGTAGTT ATGGTACCGA ATACGCCGAC AGAAAAAGAC GATGTCATTG CTGAAAACTA 960 

TTTAAAATCG AGCTACTTCA GATCAAGTGG ACATGATGGG TTTATGCAAG ATTTTGTGTT 1020 

SO GCTAAATCAT GATAGAGCTG TACCACTACC TGATGATATT GATTTAAGTA TTATTTCATA 1080 

TACAGAGCTT GTAACAGTAA GTTTGCATGC TATTCGTCGT TTTGAAAAGA AATCTATTTC 1140 

AAATAaAAAT ACATTTGGTA TTTGGGGTGA TGGTAACTTA ggTTACATTA CAGCCATTTT 1200 
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GAGTCACTTC TCATTTGTTG ATGATGTCTT CTTTATTAAT AAAATACCTG AAGGCTTAAC 1320 
ATTTGATCAT GCATTTGAGT GTGTGGGTGG T 1351 

5 

(2) INFORMATION FOR SEQ ID NO: 349: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 411 base pairs 

(B) TYPE: nucleic acid 

10 (C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



15 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 349: 

TCATCAAGTC . TACGATAAAT TAAGTCCATA TCTAAAGGCT CGGGGTCGAC AGTTTGTAAA 60 
GTATAACCAA CTGCACAGTG GCTACAACGC ATATTACAAA GATTTGTAGT TGTAAATTCG 120 

20 

ATGTTACTTA AAGTTAATTG GCCATGTTCT TTAACATCGT TATATGCTTC CCATGGGTCG 180 
TTTTGAATAC TTATTTTAGG CTTGTTATTA CGCATTTTAT AAACTCCTTA ATTGTTATTT 240 
GATACCAATT TGATACCGTT TAATCAAATA TGCTCATAGC TTGATGTTTT TTATCAGTAT 300 

25 

ATAAATGAGA GTACGTTTGA ATTGTTTCTG TAATGTTAGA ATGCCTCATT AATTCCATTA 360 
ATAAATACAT ATCTACACCA TTATTAATTA AaTAGCTAGC GTACGAGTGT G 411 
30 (2) INFORMATION FOR SEQ ID NO: 350: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1639 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
35 (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 350: 

40 



45 



SO 



TCATTTTCAT 


AGGTTATTAC 


GCAGATCAGC 


ATAATAATCC 


ATTCCATATG 


AGTcCTTATT 


60 


TTGGTTATGC 


AGCACGTCTA 


TTGGCAACAA 


GTGGCATTGA 


CTATACGTAT 


GTAAGAATGG 


120 


CAATGTACAT 


GGATCCACTT 


AAACCATATT 


TACCAGAATT 


GATGnATATG 


CATAAACTGA 


180 


TTTATCCnGC 


TGGCGATGGT 


CGTATTAATT 


ATATTACTAG 


AAATGATATT 


GCTAGAGGTG 


240 


TCATTGCTAT 


TATTAAAAAT 


CCAGATACTT 


GGGGCAAACG 


CTACTTATTA 


TCAGGCTACA 


300 


GTTATGATAT 


GAAAGAACTT 


GCTGCAATTT 


TATCTGAGGC 


ATCaGGCACA 


GAAATTAAAT 


360 


ATGAGCCCGT 


TTCATTAGAG 


ACATTTGCAG 


AAATGTATGA 


TGAACCTAAA 


GGCTTTGGTG 


420 


CATTATTGGC 


ATCAATGTAC 


GACGCAGGAG 


CAAGAGGACT 


ATTAGACCAA 


GAaTCCAATJc 


480 
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1. rAATAAT AA 


AGGAGCGTTA 


TAGTGAATAT 


CATCTCAACA 


ATTtTAATCA 


TATTTGTGGC 


ATTAGAGTTT 


TT CTATATTA 


TGTACCTTGA 


AACGATTGCT 


ACAACTTCCA 


AAAAGACTAG 


t-vSAGACAI 1 I 


AAT ATAAG CG 


TCGATAAATT 


GAAAGACAAA 


AATATTAACC 


TACTTTTGAA 


7\ » fir* r j\ r>r* f* 

UAAvj UAAGGC 


GTATATAACG 


GTTTAATCGG 


AGTTTTGCTA 


ATATACGGTT 


TGTTTATCAG 


CAGTAATCCA 


AAAGAAATAT 


GCGCAGCTAT 


TTTAGTGTAT 


ATCATTGGCG 


TTGCTATTTA 


TGGTGG C CI I 


TCAAGCAATA 


TTAGTATCTT 


TTTCAAACAA 


GGCACATTGC 


CAGTATTGGC 


actcatatca 


ATGCTTTGGT 


AAGTATTGGT 


GTTTGGGGGG 


GTGGAGATGT 


AGTCGGAGGT 


TTGGAGGATT 


TGAGCGAATT 


GTGTGTGGAC 


TTTAGACTCA 


GAGTATTTCA 


TCCTAATTAT 


TTCAAGCAGA 


GGTGACAGTA 


GCGTTGCCTC 


TGTTTCCTTA 


TAAAAAAATT 


ATTTAATGAA 


GAAAACCCAT 


ATCTGATTTA 


ATTTTCAGCT 


GATAAATACT 


CCATATATTA 


GAATGGCTAC 


TTTATCTATT 


GCATCAATCC 


TTTAAAACAA 


AAAACCCATG 


ATTTCGAAAT 


TCCCGTATGA 


TGGGGTTCCT 


ACTCTCATGG 


ATCAGTTAAA 


TAAATATTAT 


CACTATCAGT 


TTATTATTTC 


AATATTATTA 


ACAATATATG 


TAGTCGTAAA 


AGGAAAGAGG 


ACATGAGAAC 


TTCGGTGTTG 


attggcatta 


CATAACGCTT 


CCAAACATAT 


TATTTGGTAA 


CAATAAGAAA 


CTATTTACAC 


AATATATTTT 


GTATAGTAAA 


ATTATTTTAT 


AATATTTAAA 


TCCAATTGCA CAAGGAGTGA 


TTATCaTGGT 


ACCAGAAGAA 


AAAGGTTCTA 


TTACTTTGTC 


AAAAGAAGCA 


GCTATCATAT 


TTGCAATCGC 


AAAATTCAAA 


CCATTTAAGA 


ACAGAATTAA 


AAATAACCCA 


CAAAAAACAA 


ATCCATTTCT 


TAAATTACAT 


GAAAACaAAA 


AATCTTAATC 


ACTTTtATTT 


ATAGcATTTC 


TAATCTCAGA 


AATGCTATA 











(2) INFORMATION FOR SEQ ID NO: 351: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1816 base pairs 
<B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 351: 
AAAATCGCAT ATAGTAATAT GAATAACCAG ATTGTATCTA CAAAAAAGTA TATTGAAAAA 
CCAAGCGCAC CCATTAATAA TGCGAGAATA ATAATAATTT TTCTATTAAA GTGATGCGTA 
TCCGAAAATC TAGCAATAAT TGAATTTACT GTAAACTGGC TAATCGCTGC AGATGCTAGA 
AGTAATCCAT ACTGATTTGT TGTCATACCT AAATCTTTAG TTGCAAAAAG AACAAGATAT 
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TTCTyTATTT GTAaTAACGC TGCAAACATA TCCATAACCC CGCTTCTTAG AGCCCCTTTT 360 

AATTnATnAA TTAGGGGCTC TTATGCAGTT GGTGCATTAG CAACCAACTG TATTCCTTTG 420 

TCCCCTTTTA ATTTATTaAT TAGGGGCTCT TTTGCTGTTG GTGCATTAGC AACCAACTAC 480 

GTTCAATTTA ACCGAATAGT TTAAAATTAA ATACAAACCT TAAATTAGTC TAAAACTACG 54 0 

CCTTTGGTTG TTCAACAAAG CTCGCCATGA GATTTACAAA AGAATCAACT TGTGGCAATT 600 

GCAACATGCT CGGATCATAA CTCATAAATG TCGAACGAAT CAGCGGTTCA TTATCAATTT 660 

CTACTTTTTC AAACTCAAAT TGTTCTTTGC TGATATTTTT CATCATAATT TCTGGCAAGA 720 

15 TTGTAACACC TACACCACTA ATCAACATTT CTTTGCAAGT TGCTACTTGA TCCACTGTAA 780 

TAGTTGCATG GTAATCTTGT TCTAAATTAT CGTTATACCA TTCTTTTATT TGATTTATAT 840 

AAATCGGATC AGCTTGAAAC TCTATAAATG GTAACTTTGT AACATCATCT CGTCTATTTT 900 

TTGGAAAAAT AAAATAATGA TCATCATTAA ATAAATGTGT GTTAGCTAAA TTCATTACCT 960 

TATTTCCACG AGTTATCATA ACATGATAAT CTCTATGATT TGCTTTAATT TGTTCAGTTG 1020 

AACCAACTTG CACTTGTATT TCAACATTAG GAAATTGGGC ATTATATAGG CTCAAAACTT 1080 

CAGGAAGTAA GGTTTGTCCA ATCAAAGAAG AACACCCGAT TGATATTGTT CCATTCACTT 1140 

CACCAATATG TGCCTGCATT TTGTCAAAAA ATAATCGCTC TCTTTTCAAC ATGTCACGAG 1200 

CATGCTCAAT AATCATTGTT CCTTCAGTTG TTGTAATCAA TTGTTTTTTT GTTCTGATAA 1260 

AAATATCTAC TCCAAAAGCA TTTTCAATAG CTTTTAGTCT TTGTGTAACA GCAGGTTGAG 1320 

ATATATATAA AATTTCAGCC GCTTTACGTA ACGTTTTCGT TTCGTCTAAT GTTATTAGTA 1380 

55 AACGATAGTC TTCAATCTTC ATAATTTCCC CCCATAAATT ATTCAATTAT TGAACTTTCA 144 0 

TGGCTACAAG CATTCATGAG TTCATTACTA ACGAATAATT TCACCAATTT TATTGGTATG 1500 

GCTGCAGCTT GAATTACTTA GTTTTTCTTT TGTTGTTGGT GATTTTTAGT TTGATTATAT 1560 

TGCTTAGGCT TTATTTGTTT GCTTTTTTCA ATATTAGTTT TATTTTGTGG CTTTTGATGA 1620 

TTTTTTTGAG CCTTTGCATT AATTTTATTA AAGCAGTACA TGATTTTCTT TTGGAATCCT 1680 

TTAAAATCAT TTTCTAACTC TGCCATAATT TGATGTGCAA TCATATATGC TTCATGAAAT 1740 

TGCTTTTTTG TAATTTGCTC ACTTTCTAAT GCAAACATTA AATCATCTTC ATCTACCAAC 1800 

TCATaTcACC ACTTGG 1816 
50 (2) INFORMATION FOR SEQ ID NO: 352: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 9956 base pairs 

(B) TYPE: nucleic acid 
55 (C) STRANDEDNESS: double 
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<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 352: 



s 


GCGTTGTCGT 


CGATGATTAA 


TAAAGTATGG 


GTATACCATT 


AAGAATAACG 


CTACCCAAAT 


60 




gAkTGCTAGT 


GACGTGCCGC 


CAATGACATC 


TGAAAAGTAA 


TGTGCATGAA 


AATAAAGGCG 


120 




ACAAAATAAT 


ATGCTAAGCC 


ATAATATTCC 


CATAACCAAC 


GCACTCAACA 


CTTTTGTTAT 


180 


10 


TGTCTTAGCA 


GCAAGTGAAA 


TAATAATGAT 


CATTAAGGCG AAATATAATA ATGTGCTGGC 


240 




GTTGGAATGT 


CCACTCGGAA 


ATGAAAAGCC 


TGTATCAACG 


GCTAAATGAT 


TATATGGTCT 


300 




TGGACGTAAT 


ACAGTATCTT 


TAATTAATTT 


GTTCATGATG 


ACACCTGAAA 


CCAAATATGT 


360 


15 


CACAAACCAA 


ACCGCTAAAT 


GCCTCTGTTT 


AATAAACAGT 


ATGATTGTGA 


CGATAATGGA 


420 




AATCAACACG 


ACACCTTTGA CATCTCCAAT TTCCGCACTA AACGTCATAT AGTAATTAAA 


430 


on 


CAAATTGTTA 


ACATACTGAC 


GTTGTGGCTC 


ACCGAAATAA 


TCTGTAAACC 


ATGTTAATGA 


540 




TCCCATATCT 


ATATTTTTAA 


GCCATTCTTG 


ATTTGTCACT 


ACACTGTAAA 


ACATACCTAT 


600 




AAATACAATC 


AGCGCGATTA 


AAAATAAAGG 


CACTGTcATT 


TTCGGTGATG 


TTAATTTTTT 


660 


25 


ATCTATCATC 


TTACAATCTC 


CTCGTATCAT 


CATTTTCATT 


TTACAAATGT 


TATCCATAAT 


720 




ATCAATGTGC 


CACAAATTTC 


ACTTTACCGA 


CAATATCAAA 


ATTATAAAGT 


TCATATTGTT 


780 




ATGTATATTG 


CAAATAAAAC 


ATTGTATAAT 


TGAAATAACA 


ATATTTTGCT 


ATTTTCAATT 


840 


30 


TAGTACGATT 


TATATTTATT 


ATACAGAGGG 


GGTAAGGCGT 


ATCAATAGAG 


TTATTTTTGT 


900 




CTATATAGCG 


TTAATCATTA 


CATTAGTTAG 


ATTCTTTACC 


CCTATTCATC 


CATCATTTTC 


960 


35. 


AAATTTGATT 


TACTGGATAT 


TTGTATTATA 


TTTTATTCCT 


ATTATACTAT 


GCGTTATCGG 


1020 


TTTCAAGGCC 


GAAAAACTTA 


TTGCAACAAT 


GGTCATTATA 


CCTAATTTTT 


TAGGAATACT 


1080 




TTATCGATTA 


TATGCCTACG 


TCACACATAT 


ACTCTTTATG 


TAAAAGGATA 


GTGGGCATGT 


1140 


40 


CTCGCAACAA 


ATATGCTTGC 


GTCGACTTGT 


CACCATTCGC 


AAATTTTATG 


ACATACGCCT 


1200 




TTCACGGGCT 


ATATTCAGAC CCACGCATTC ATCCACGTAA 


TAAACACATC 


ATGTAATAGA 


1260 




AAAACAGCAC 


ACCCAAATAT 


ATGGCGTTGC 


GCTGTTTAAC 


CAAGCATACT 


TCTATAGCTT 


1320 


45 


TAATAAGCCA 


GCAGAAGCAT 


ACCTAACCTT 


CTTAAATATG 


CTTTTCCAAA 


TTATCCTCAA 


1380 




GTTTGAATAC 


GATAATACGT 


TCACCTGTAA 


CTGTACTTAA 


ATCACTATGG 


AAGCTCATCA 


1440 


50 


CTTTGATACC 


TGTAATTTTA 


AAAATGATAT 


CATTCAAATC 


TTGCTCACCG 


GATTCAACTA 


1500 


ATTCAGAACG 


TGTTCGTTTA 


ATATTTAATA 


ATCCTTCATT 


CGTACTACAT 


ACACGATATT 


1560 




CAGCTGGCGT 


TAAGATACCT 


TGTAAACTAA 


TAATCACCAT 


ATCTCTTAAA 


ATGTCTGATT 


1620 
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TTTCAGCTTC GATTTCACCT TTCGTTCTTT TCATATCACT AACTCCAATA ATATTAAAAT 1740 

TGATTACTTC ATCTTTGTAT CGTTATCACG ACATCAACTA TTACATTAAG TTTATCATTT 1800 

TTAGTATATT TTAAGAAGCT AGAACATTGT AGATATGATG ATATATTAGT TACTTAGCAT 1860 

CGCAACATAT CATCGTTAAA TCCAACTTTT AAAACGCCCT TCCTCATTAA CGCTCATTAA 1920 

ACGCAGCCAA TGATTAGACA CCTTCCTAGC GAAATGCTCA TTATTCGCGA GTAGTCTTGC 1980 

TACAACATAG TCGGGTGCCT GAATAACGAC AAGTAAACGA ATTGGCGAAT GATACATCGT 2040 

CCGATCAGCA GCCATAACAG ATTGCCATGA TAAGCCATAC ATCAGATCAC TCGCATTACC 2100 

TTGCATGACA CCAACACCTG ACGTGACGGT TTGTGTCGCT TTATTCCCAC TTCCGTAAAA 2160 

ATGCGGCGCA ACTGTCGACG CATAATATTG TAAATTAATC CATTGTGCCA CAAGTGCCGG 2220 

ACCAGAAATG ATGGTATTTA ATAATGTGCC ATCTTTATCT TTACGCCAAT CATAATTGTG 2280 

20 TAAAAATGTC CGCCCTTCTA AATCAATGCC TTTTGTTAAT TGGCGTCGTC CAATTATAAA 2340 

TGATGCATTT TTAGCCAATC CCCATTCTGG ACGTACCTCA CTCCAATCAC TCGCAAACCG 2400 

CTGCGCTTCT TCCACTGGAT GATTCACACG ACCAATCGTT GGCAGTTTGT CCAAACGTTC 24 60 

GCGATTCGcg TGtTCAGAAA TCATCGGCAT CGCGTCATTC AATGATTCAT ATGCATCTAA 2520 

AGCAATAGAA GATAATGTGT CTGGCACATA TACCCATGCC AACGTATCAG TAGACGTATG 2580 

ATGTTCTGCT ACCGCAAAAA CAGTTGTCTC TGGAATATAC ACACCTGATT GTTTTAATCC 2640 

TTGTCTGACA TTTGGACGAT TACATATCAT CGCTAATAAC TTAGCATTAA AACCGCTTGA 2700 

TGCGCCACCA CAAGCCCCAC ATTCAAGTGA TGCATGATGT GGATTATTGT GAGAATGACT 2760 

35 AGCATGACCT GCTAACACAA CGAACGGCGC AAATGCTTCG GTTAAATCCA TCAATTTCAA 2820 

CGCTTGTAAC GCGAAATCAA TTTGCTCTTG CTCAGTAAAT CCAACAGGTA AGTCTGATGT 28 BO 

TCGGTCAAAC TCACGATCAA TCGTCAACTT TGTTTCAGGC TTTTTCAACC ACTTTTGTTT 2940 

TATTTTTTGT AAAGACGCGC GACTTTTTCT AGGCATAATC GAATTGACAA TGGTACTTAA 3000 

GCTTAAAAAT GGCCCACTTA ATTCAGGCAA TAACAGACTA GGCATGACAT TATTTTTCAT 3060 

CAATTTAAAT GTGTAAAACA TCGATGACAT TGTCTGTTGC TGTTGTCGAT AAACATTCAT 3120 

ATCGTAGCGG TCTGCAAATT CTTTAATGCG ATATGCCGGC GGTACCATGA CAGGTAATGA 3180 

ATCATGTTTG AATTGTTCGT CTACGGCATC TTTTTGAATA GGTAATCCAA AGAAGCCTGC 324 0 

SO AATACCAATC GTTTCAAAGG GCCCTGCTGC TTCGATATGT CTACGAAATG GTTCTGAACG 3300 

AACATCTATA CAAAATGCAA TTTGCGCTTT CGTTGATGTG CCCATCTGAT TTAGCTCGCT 3360 

ATTATTTTCA TCAACTGCTT GTGTGTCATT TAACAATACT GAATGTGGCT GATTAGCGTT 3420 
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TGCTTTAATT TTTTGTTTTA ACTGAGATTC 
ATTTTTAAAT ACATTTTTAT TCATAGTTGC 
5 GACGTCATGT TGTAGTAATA CATCGCTAGG 

AGTTTGCTTA AACCAATTTT CCGATCTACT 
ATCACCAACT AGCAATTGTT CGACAACTAA 

10 

TTGTTCAAAG TGATGCTGTT GTGAACGGTA 
CAAAAGATGT CCTTCAACAT AAGCTTGGTA 

15 TACTGACTCT ATCGTCATTT CAGGATCATT 
TTTAGTAAAA CTATGGTCAT GTTGCGCTAA 
ACGCTTCGGC ATTGTCCAAC TCGATAGAAA 

20 CATTTGACGA TTCACTTGTT CGCTAAGTGG 

CATCGGACGT ACATCATAGT GATGATATGA 
TAGTAGATCA GCAACAACAT CAACATTTGA 

25 

TAATGTTTTA ATGTTATCAA TATAAAGATT 
TTCAAGTAAC ATATCAGTAA CAAGTTGATT 
CACAGCGCTT TCTATTAATG CTTTATTTGG 

30 

CCATTTTGCG ACATCTTCAA ACGTATCCGC 
AAAAATCGAA ATTGGTGATA ATGGTGTAAT 

35 GATATTTAAC TGTGTTGTCA TACCTTTCAC 

ATGACTTTCT ATCGCTTTCG AGCGTGCTTC 
CGCAAAAGCC TTAGAGTATC GATGCCGCGC 

40 TAAAATAACA ACACTAATGA TGACACTCAC 

ATTTTGTAAT ACAGCGTAAA AATAATTATG 
AATCAAAATC ATACCAACAA GACGTGCCAT 

45 

CCAAGATACA AGTAATGACC ATCCTAGAAT 
GTCACTACTC ATCCAAAATA GAAATGCCAC 
SO CCAGCCATAA GCGTCTTTAG CAGATGCTTG 

ACCTGATTGT AAAAATAATG TTGCTTTAAA 
TGCTGAATAT ACACCCAATG CACATTGAAC 
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GTATGTCATT TCCCAGGCAA TTAGCCATAA 3540 

TGCAAAATGA ATAAACGTTT GAATTTCATT 3 600 

CATATCACTG TAGTAACACC ATGATGCAAC 3660 

TTCACAATCT TTAGCGACTG ACTTAAACTC 3720 

CCGAATTGCC AAATAATCCG TTAACAAATG 3780 

ATACAACATA CCTGCCCAAC CCGGTAACGC 3840 

GTCTTCCTGA TCTATTGAAA AATGAGTTAA 3900 

GGGTAAGCCT TTAATCACTT GGCGCTGTGC 3960 

ATGCAACCAT GCATGGTAAA AACTTTGcTC 4020 

TTGATCGATA TAAAGTTTCG TCCATTTAAT 4080 

CTCACCTTGT TCATCTATTA TTGCATCACT 4140 

TTCAGCCATA TCACGTTTTG ATTTTTCTAA 4200 

ATGATTCATA TATGATGCAG GTACGTCTTT 4260 

GATGTAGTGT TGCGGGATAT TGTAGTGATG 4320 

AAAGACACTT TCATCTAATT CACCACGTGC 4380 

GAAAATATCC ACATCTCGAA CATCACGTAA 4440 

TTCTAATCCT TCCCATGGAT TTCGTGCTGC 4500 

AACACGTTTC GCATTTTCAA TGACTGAATT 4560 

CTCCTATAAA TACTTCTTCA AATAATTCGG 4620 

ACCTAGATTA ACTAACCACA CGTACAATAC 4680 

CACCCAAATA CTTAATAAAC TGCCAAAGAT 4740 

TGTAGGCGGC GTTGTCGCAT GTGTTGTTAT 4800 

TGTGATGACG TAGATAAATG TCACGATTGC 4 860 

GCGTCCTTTA CTAAAGGCTA CCATTTGATT 4 920 

GAGTGCACTT AACACTTCAT ATGCACTTCT 4 980 

GATAATAGCT AATACACGTC CCATGACAAT 5040 

TTTTGGAATA TTGAATCGCT TCACGATAGA 5100 

AATACCGTGC AATATTAAAT GAATAATCGC 5160 

TAACATAAAG CCCATTTGAC TCATCGTAGA 5220 
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AHAAATAPTA 


ftAAAfZHATAA 


P.TA ATAATfJA 
u InnlnniUn 


TAACGCAAAT 


CCATTATCAA ATATCGGCGC 


5340 




A A A A A(TTT 


AP.AATAAPAP 




CACAATTCCT 


GCATGCATAA 


TTGCCGATAC 


5400 


5 




GPPfiTTAPAO 


ATTPAATPAA 


CCATCGATGA AAAGGAAATT 


GTGCTGCCGG 


5460 




TATPATHAPA 


CPTAATAPAA 


f^TAflTAPATT 


CGTCAACAAT 


GACCATGTCG 


GATGAACTAT 


5520 


10 


TA TffTTrtTrWF 
Alui 1 O 1 \J\3 1 


APPPflPPAPT 


PCPPAf2TPf2P 


AATATAAATA GTTACAATTG 


CTCCAACGAA 


5580 


TGCAAGCCAA 


CCACATAAAA 


ATflTP A*TY2PT 


TGATAATTTC 


GCAGACTCAC 


GTGGCACTTT 


5640 




CCAAAAACGA 


TTAACGTTCA 


TPfif^P A aTCIT 
1 UiuLnn lol 


TAAACATAAT 


AATGTAATAC 


CCCAGCAGAG 


5700 


15 


TGCCATCAGT 


CTTAAGTCTT 




TGCTAAAGAT 


GCAAACGACG 


TAATCGCAGT 


R760 

3 ' V VJ 




GAACAATGGA 


AAGTAATGTC 


lAIAAlUA J.U 


ATCACCTAGT 


AAATATCGCA 


TTGAAAACTT 


coon 




TTGAATAATA AAGCCAAGCG 


PPRTTHPH TV TV 

CCAI 1 ALAAA 


GCCAGCTAAT 


AACCAAGATA 


AACGATCTAT 


coon 


20 


TTTAAATGGA 


CCTAAGACAT 


r*ffVTV^ TA P r» TA IV 

G l IajAv- L-A I\3 


AATACCGAAA 


AAGCCAATGA 


CTGCAAATAA 






TACTGGCATG 


ACTAGTATGT 


1\ T» 7\ TV T\ TfTTV TA 

ATAAATGTAA 


TTTAATATAT 


CTCATTGGCA 


TAACTGGTGC 


0 uuu 




TAAAAACAAC 


AAGCCACTTA 


TCAATGCAAT 


GATAAGCGCA 


ATAACAAACA 


GTGAAAATAG 


cncn 


25 


CAATTGAAAA 


CTTAACACTG 


CATAAC CT CC 


TTATTTCTAA 


TCTCTCGCAT 


AATTGCTTAT 






GTATAAAAAT 


AAAAACCTAC 


TA TA T*7AfPTAf* TAT 

AAIAVjI AUA1 


TCTGTACATA 


ATGGCAGAAA 


ATTTACTATT 


OlOU 


30 


GCAGGTTTCA 


GTTTAACTAG 


AL-Al- i\?L~A 1 L. 


ACGGTACGTT 


GATATACCTT 


GTTGCAGTGT 


£240 


TCTCTTTAAG 


CGTGCTCCCA 


TGCACATATG 


TATATAAAAT 


GTTACTTCTG 


TCTGTTCAAT 


O J u u 




TCATCTTCAT 


AAATATGCTT 


TGCCTAGACG 


AGACCTAACG 


TGTTATTCGT 


TTTAAACTTA 


6360 


35 


TAACATAAAA 


TATAATTAAA 


TTTCTGCTTC 


ATGTCAAATT 


CATGAGCTTA 


ACCTCTATTA 


6420 




AACCAATGAT 


TGTAAAGATT 


TTGTAAATGC 


ACCTGTACAG 


TTAGGCAGTA 


TTTCCCGTCC 


6480 




TTTTAAAATA AAAAATTCGC AGTTATGATC 


ATAACAATTC 


AAGTTAGGAA 


AAAAATCAAT 


6540 


40 


TACGCACAAG 


ATAACTATGT 


ACAATGAAGT 


TAACTCATAA 


GCAAAGGAGG 


TAATCTTAAT 


6600 




GGGTATCATC 


GCTGGCATCA 


TTAAAGTTAT 


CAAAAGCTTA ATCGAACAAT 


TCACTGGTAA 


6660 


45 


ATAAGATTTC 


ATAACAAACA 


AAGGAGGTCT 


TTCACATGGG 


TATCATTGCA 


GGAATCATTA 


6720 


AATTCATTAA 


AGGATTAATT 


GAGAAATTCA 


CTGGTAAGTA 


AGTTATAAAA 


ATCTCATAGA 


6780 




TATGAACATC 


TTATTTGAAG 


GGGGCCATTC 


ACATGGAATT 


CGTAGCAAAA 


TTATTCAAAT 


6840 


50 


TCTTTAAAGA 


TTTACTTGGT 


AAATTTTTAG 


GTAACAACTA 


ATCTCAAACA 


TTAACGATCA 


6900 




ACAACTCATC 


ACTATGTTAA ATCAACATAC 


AGGAGGACAA 


AACGATGGCT 


ATTGTAGGTA 


6960 




CTATCATTAA 


AATCATCAAA 


GCAATTATCG 


ACATTTTCGC 


AAAATAATTT 


AAGCGAATTG 


7020 
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TTATTGATGT GAGGTGAGTC TTGTTAGTTT GTTGCAAATA AATGGTCTTG GTGTTTTTTG 7140 

TATAGGACGT TCTTAGTGGG ACATACGGAA TATTCGTGAT CTTTGTAGTC TGACGCGTTA 7200 

TATTTTTGTG GCGTG TTTTA TGTTTGATAC TGGAGTTCTG AGACATTCAT GATTTGGCAT 7260 

GCGAAATCTT AATGATTTTC ATGATCTAGC GCAAGATATA TTGGCCACGT GCGGAATTGC 7320 

GTTGCACGTT TAGACTGAAA CACTCGTGTG ACCGTAAGTG TTAATAGTAC ATTGATAGCT 7380 

GCATTTACTT CACTCATTTT TATGACTGTT AAACAATGAT TGTACCTTCA ATTAACAGTT 7440 

GGTACGATGG TTTTGCCATT TTTCATCAAC GTAAATATAA AAAGGACTAA GACACATACA 7500 

15 TGTCCTAGCC CTATGGATAA AATGCAAATT TCTGCTTTAT CAAAACTATC ACACTTTAGA 7560 

TAGATTGAAA ACAAAAAGAT CCTAAGAACA CCTTAACTTT TTATTAATTG TCATAAATTG 7620 

CAAACAATTA AGCCACAATT CAAAAATGAT TATACTTCAT TCAACTTATC GTGCTGGTCT 7680 

AATTTGCCAT TGATATGGAT CTTCAAATTG TTGCCAATCT GCATCAATTT CTTGCGCATT 7740 

GACTAAGCAT GCGTCGAGTT CTTTTGTTAA TTTTTCTTCA TCTAATTCTG TACCAATAAT 7800 

GACAAATTGT GTATGACGAT CGCCATATTC TGGATCCCAT TCAGCTGCGA CATCTTGACG 7860 

TTCTGCTAAT ATTTGTGTTT GTTGCGCTTC AGACATACTA GCCACCCAAT ATGTAACTGG 7920 

ATGAATATTG CAAGATGACC CTGCTTGAGA TAATAAACAT GCTACGTGAT TGTATTGTGC 7980 

TAGCCATACG ATACCTTTTG ATCGAACGAC ATTATTTGQC ATGCTTTCTA ACCAATCATT 8040 

GAACCTTTTA GCATGGAAAG GTAGACGACG TTTATATACA AACGATGATA TACCATATTC 8100 

TTCTGTTTCA GGTGTATGCG ATGCATGCCC ACCAGACTCA AGTTCTTTGA TCCATCCTGC 8160 

35 TGACTCGCTC GCTTTTTCAA AATCAAAACG CTGCGTATTC AAGACTTCTT TTAAATCTAC 8220 

TTCAGAATTT GTTGTCTTAA TAATTTTAGC AGTCGGTTGC AATGCGCTTA ACATTTTTTC 8280 

TAACTTCGCT AGTTCTTCTT CACTAATTAA ATCAATTTTA TTAATAATCA ATACATCACA 8340 

AAATTCAACT TGGTCAATTA ATAAATCAGC AATCGAACGC TCATCTGTTT CGTCAACGCT 8400 

TTGATCACGA TCCATCAATA AATCTTCTGA GTTGATGTCA TGTACGAAGC GGTTAGCATC 8460 

CACAACTGTA ACCATTGTAT CTAAACGGCA AATCGCTGTA AGATCAATGC CAAGTTCATC 8520 

ATCAATATAT GAGAAAGTTT GTGCAAGAGG TACTGGCTCT GAAATCCCTG TTGACTCAAT 8580 

AACAATTTGA TCGATGCCAC CTTTTTTCAC TAAACGCTCA ACTTCTTTTA ATAAATCGTC 8640 

SO TCTAAGTGTA CAACAGATAC AACCATTAGA AAGTTCGACT AATTTTTCAT CTGTACGCGA 8700 

TAGTCCCCCA CCATCTGCGA CAAGATCTTT ATCGATATTT ACTTCACTCA TATCATTTAC 8760 

AATTACCGCG ATACGTCGAC CTTCTCGATT TTGTAAAATA TGATTTAACA ACGTTGTCTT 8820 
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ACTTCAATTT ATTTGTAAAT AGGAATAATT CTGTTTTACA TTATATAGGA GCGTTTCCTC 8940 

TTTCGCAATC TTCGATAATA AAAAAATAGT ATACTTAATT AAATTATTGA GCGCTTTACT 9000 

TTATAATGGA GACAAAGATA TATCTCACGA AAGAGAATCG AGGTGTATAA ACATGTTATT - 9060 

TGTCATTTTA GTTTTATATG TTACTGGTAT TGCATTTATT CTACTCAGTG TTTTTGGTTC 9120 

AAAGACTGAA GGATTATCTA CGAAACATAC TTTATATACC ATTGGCAGTG CTATTATAAC 9180 

GATTGCTATT TTCATTTCAA TTGGCTATGC CATTCAATAC TTAACTGCAG CGCTTTATGG 9240 

TTTGTAAGGT GAAGGTGATG AGTAACGGGT AGTTCGGGAG AGGTTAACTT GCGTTGATTT 9300 

75 TGATAAAGTG ATCATAGCTT TTAGTACTTG AGGATTTTTA TTGTTGCTGT TACGAATGTG 9360 

GTCATGTTTA ATGCGGGACA GTAATTTAAG TTGTTTTTTT ACAATTGAGA GTGTGATATT 9420 

TCGATTCGGT TCGAATTACT TTACATGGGA ATAATATAAA TTAAAAAGAA GCGGCCTAGT 9480 

20 GTCAGTTGTG AATATACTGA ACATTGGTCG CTTTATTTAG TAGTATGATA TGTAGTTTAG 9540 

CTATTAATTT TTTTCAGGTC ATCCTTAATG CTGTCTATCT CAGACATGGC ACTTTTAACC 9600 

CAATCTCCTT GAGCTGCACC TTTAAAATTA GCTTTAAAAg CtTCGCAATG TTGCGCCATT 9660 

TGTTCAATTA ATACTTTTTC TTCACCTTTT AATCCGTTTT CAATATCTTT GTATTTATGC 9720 

TTATGTTCAG GTGCAATAAC TGTGCGAATA TTTTCTTTTT GCGCTTCCAT TTTAGATATG 9780 

AGATTAAGTG TTTCTACTGT AGTACTTATA TCTGGCATTC TTAAGGTCAT ATCTGGTTCT 9840 

ATTAGAGTCA TTTAATCTCC TCCAAATTAT CAGTCACTTA. GCTTATCTAA CTGCTTTTCA 9900 

TAAGACTTTT TTAAGTCTTC TTTATATTCT TCTAATTTCC CATTCTTGCT TTCTGA 9956 
3S (2) INFORMATION FOR SEQ ID NO: 353: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2411 base pairs 

(B) TYPE: nucleic acid 
4Q (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 353: 

45 

TTTCTTTTAA CAGaTTTATC cCATTAATTG TTCTACAAGC CCACGaTGAG CAATATCATT 60 

TTTAGCAACC ATTAATAAAC CAGAAGTATC CATATCTATA CGGTGAACAA TACCTGGACG 120 

so AATTTCTCCA TTAATACCTG ACAAATTTTT AATTTGATAC ATTAAACCAT TAACTAATGT 180 

ATTGGTATAA TGCCCTGGTG ATGGATGAAC TACCATGCCT TTCGGTTTAT ATACAACTGC 24 0 

AACATCGTCA TCTTCATAAT AAATATCTAA ATTTAAATTT TCAGGTAGAA TATCAGCTTC 300 
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AACAACTTTA TCGTTTGCAA CGACTAAACC TGCTTTAATC CAATCTTGTA TCTGGTTACG 420 

AGACCAATCA TTATTTAATT CAGGCAGCAA CTTATCTACA CGCATACCTG TTTGTTCTTT 480 

ATCTGTAATG TTAAATTCAT AAGTCTCCAT TACTTAACCT CCTTCTCCTT TTTATTGGAA 54 0 

GTATCCTTTA ATAAGGCAAT AATAATTAAT ATTACACCAA TTGTTAAACT TGAATCTGCG 600 

ATATTAAATA TTGGAAAATC ATAACCAAAA ATATTTGTAT CAATAAAGTC AACAACTTCT 660 

CCTGTTAAAA TTCTATCAAT AAAGTTTCCA AGTGCACCTG CAAAAAGTAA ACTAATAGCA 720 

ACTTGCATAA ACAAATTATA TTGAGCATCT TTAATAAAGA AATATACTAA GG CTATTAAT 780 

, 5 ATAATAATGG TAATAATAAA GAAAAATGTC ATTTTTCCAC TCAATATTCC CCATGcAGCA 840 

CCATTATTTC GATGTGaTGT TATGTTTAAA AAGTGCGGTA TCACTTCAAA TGAATCTCCA 900 

ATTTTCATTG TAGTAGCTAT AATATATTTA GTAACTTGGT CAAATATAAC GACAAATACT 960 

GCTATTAAAA TGGAAGTGCC AATAAAATAT TTTTTGTGCA TTTTCGTTCC TCCAATCAAT 1020 

CGTCCATGAG ACAACTCTTT ATATTATAGC TTACACCTGC TAATAAAAAA AGTAAGCATA 1080 

TTACATTAAA TCTAATGTTA CTAACTCAAT ACTTGATAAA CTACTATGTT TTGACATTAA 1140 

ATATGAACTT AATTATTCAT TTATCATATT TAAGATGACA TTAAAAATTA GGAAAGCAGG 1200 

CTGGAACATA AATCCCTAAA AAGACAGTAG TAAGATATTT TCTAATTAAA AATTATCTTA 1260 

CTGCTGTTCT CTATTTATAC AATACTTCGT ATTGAATGGC TTCGCTATGC CCATCTGGCA 1320 

CATTACTGTA AAATTCTATA AATAGAATTT TTGATGATGG GTCCCTTCCT AGGGTGCCGT 13 80 

CTCAGCCTCG GtCTTCGACT GGCACTGCTC CCTCAGGAGT CTCGCCATTA ATACTACGTA 1440 

35 TTAACATGTA ATTTTACTTT TAAATACTTT AAAAAAATAA GACATGAATC GTCTACACTT 1500 

AATTGGACAA ATTCTATGAG AATAGATATT GTTAATTTAA GAAAGTAGGC TATTTTGAGT 1560 

TtCACTCGAA TGTCAGTTCG AGGAATAAAT AAAGTTAAAC GAGAGCTAGG TTTTGTATTA 1620 

ATGGCAATTA ATATAAGGAA AATAGCAGCT CAACGAGCTG TACATTATAA AATACATATC 1680 

AAAAAAGCTG ATTTCTATCA AATAATTAAT AGAAATCAGC TTTTTTACAT TGCCTAAGAA 1740 

CTTAATGTCC CAAGCCCTAA AACTTGTTGT TATTTATTTG ATTTAGCAGC GATACGTTTA 1800 

TATCTTAAGT ACATAAATGC TAAAAGTATA AACCAAATCG GAATAAAATA AATTGCACGT 1860 

CTTGTATCAA CATTAATAAA TAATAACCCG AACACAAAAA TGAAGAATAC AAATATTAAG 1920 

so TAGCCCATAT ATTTGCCACC TAATAGTTTG TACGTAGCAT TTTTATGTAG ATCTGGGTTT 1980 

TTACGACTAT AATTGATATA TGCAATGATA ATCAGACCCC ATACAACTAA AAATAACACT 204 0 

GTAGAGATGG TAGTCACATA CGTAAATACT TTTGTCGCAT CTGGGAAAAT ATAGTTTAGT 2100 
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TTATTCGTCT TAGAAAAGTT CGGAGGTGCT TGTyGTTGAC TTGATAAACC GaAAAGCATA 



2220 



CGGCTATTTG AGAATATACC ACTGTTACAT GATGAAGCAG CAGCGGTTAA TACTACAAAA 



2280 



TTAATCAAGC CCGCAGCAAA CGGAATTCCG ATCAATGCGA ATrATTTTnC GAATGGACTG 



2340 



TTATCAGGAT CAACTTGCTG CCAAGGGGTA ATAGACATGA TAACCGCTAA CGCCCCAACG 



2400 



TTnnATATTA A 



2411 



10 



15 



20 



25 



30 ■ 



35 



40 



45 



50 



£2) INFORMATION FOR SEQ ID NO: 354: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 605 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 354: 

GnGAATTATT TTTAATAATG AAAGGATTAC TTnCATGGGT TTTTACTAGG AnTACCCAGA 60 

AGGTCAAAAT ATTTTTGATG CGCTAAGTCA ATATGAAGTT AAGCGACGCG GCGATATGGA 120 

AGAGGATCCA TCATATAAAC AACTCATTTC TTATTGTTTA CTTGAAAATG AGCATGGCGA 180 

GATATTAGTG TATGAACGAT TATCTGGCGG TGGAGAAGCT CGATTGCATG GACAATCTTC 240 
AATAGGTGTA GGCGGTCATA TGAATGATGT TCCAGGAGCA GAATCTATTA ACGAAGTATT . 300 

GAGAGTTAAT GCACAGAGAG AATTAGAAGA AGAAGTAGGT TTAAGTGAGC AAGATTCACA 360 

AAATATGGAA TATATCGGTT TTATTAATGA CGATAATAAT GAAGTGGGCA AGGTACATAT 420 

TGGTGTTGTA TTTAAAATCA CTGTAAGTAC GAATGATGTA GAAGCTAAAG AAACAGATAC 480 

TTTACGAATA AAATGGGTTG AAAAAGGCAA CATAGAGTCA TATGATGATT TCGAAACGTG 540 

GAGTGCATTA ATCCTTCAAG ATTTATAATC AAACGAGGTG ACATATATGT CAGATATTAT 600 

TCCAG 605 
(2) INFORMATION FOR SEQ ID NO: 355: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 668 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 355: 
TTTATTAGCA CATCCAAACT ATTCATATGT TGGACAATTT TTAAACGAAC TAGGATTTAA 60 
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ACAATTAGAC ACTGAACATT TAGCTGATTT AAATCCAGAG CGTATGATCA TTATGACAGA 180 

TCATGCTAAA AAAGATTCTG CTGAATTCAA GAAGTTACAA GAAGATGCAA CATGGAAAAA 240 

5 GTTGAATGCA GTTAAAAATA ATCGCGTGGA TATTGTTGAC CGTGATGTTT GGGCAAGATC 300 

TCGTGGCTTA ATTTCTTCTG AAGAAATGGC TAAAGAACTT GTTGAATTAT CAAAAAAAGA 360 

ACAAAAGTAA GGTGGAAGTA AATGGCTATA AAAGAAATAA GTAGCCAATC TGCCATAGAT 420 

10 

CATAAAAGAA AAAGACGCAC AACACTCACG TATATAGTGA GTTTGTGCTT TCTTTTTATT 480 

TGTATATATT TAAATATGGC GATTGGTTCT TCGAAAATTA ATTTT AG CGA TATCATTCAC 540 

15 TATGTTACTG GTCATACAGA TACGAAAGCA ACGTTTTTAT TGCATAATGT ACGTATGCCA 600 

AGGATGATTG CAGGGTTATT TATTGGCGGT GCATTAGCGG TATCTGGTTT GTTAATGCAA 660 

GCAATGAC 668 

20 (2) INFORMATION FOR SEQ ID NO: 356: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 787 base pairs 

(B) TYPE: nucleic acid 
2$ (C) STRAND EDNESS : double 

CD) TOPOLOGY: linear 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 356: 

30 

ATACAAAAAA ACATATCGAA AATAAAGCTA AAAGAAACTA TCAAGTTCCA TATTCAATTA 60 

ATTTAAATGG TACATCTACA AACATTTTAT CGAATCTTTC ATTTT CAAAT AAACCTTGGA 120 

35 CAAATTACAA AAATTTAACT AGTCAAATAA AATCAGTACT GAAGCATGAT AGAGGTATTA 180 

GTGAACAAGA TTTAAAATAT GCTAAGAAAG CTTATTATAC TGTTTATTTT AAAAATGGTG 240 

GTAAAAGAAT CTTACAGTTG AATTCAAAAA ATTACACAGC AAACTTAGTT CATGCGAAAG 300 

40 ATGTTAAGAG AATTGAAATT ACTGTTAAAA CAGGAACTAA AGCGAAAGCA GACAGATATG 360 

TACCATACAC AATTGCAGTA AATGGCACAT CAACACCAAT TTTATCAAAA CTTAAAATTT 420 

CGAATAAACA ATTAATTAGT TACAAATATT TAAATGACAA AGTGAAATCT GTATTAAAAA 480 

45 

GTGAAAGAGG CATCAGTGAT CTTGACTTAA AATTTGCGAA ACAAGCAAAA TATACAGTAT 540 

ATTTCAAAAA TGGAAAGAAA CAAGTAGTGA ATTTAAAATC AGACATCTTT ACACCTAATT 600 

TATTTAGTGC CAAAGATATT AAAAAGATTG ATATTGATGT AAAACAATAC ACTAAATCAA 660 

SO 

AAAAAAATAA ATAAATCTAA TAATGTGAAA TTCCCAGTAA CAATAAATAA ATTTGAAAAC 720 

ATAGTTTCAA ATGAATTTGT GTTCTATAAT GCAAGCAAAA TTACmATTAA TGaTTTAAGT 780 
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(2) INFORMATION FOR SEQ ID NO: 357: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 534 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 357: 
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AAAGTAAAAA 


TAAATCTCCC 


TTTTTAACTT 


TCGTTTCTGC 


CATAGCCATT 


GCTTCTTCTG 


60 


TGATAGTTGC 


TACAATATCT 


TTTCTTTCAC 


GGTTAAAATG 


TTCAACTTGT 


TCTGCTAAAA 


120 


ATGCAGCTTC 


TTCTTCGACG 


TCAGTCATCA 


ACAATTCGCa 


AGCTAATGAT 


GCGTCATCTA 


180 


AACGACCTAC 


AGCATTAAGT 


CTAGGTCCAA 


TAATAAAACC 


AATTGTTTCT 


TCATCAATAT 


240 


TGTCATTGTA 


TCCCGCTTCT 


TTTAGCAATG 


CTTTAACAGA 


GGTCGGACAT 


TGATCATTTA 


300 


AGACTTTTAA 


TCCTTGTtTC 


ACTAATGATC 


GATTTTCATC 


AGTTAAGGAT 


ACTAAATCCG 


360 


CAATGGTACC 


TATCGCAACT 


AATGCTTTAA 


AATAATCAGG 


TACATTTtCA 


ATCAATGCTT 


420 


GTGCTAATTT 


GTATGCAACA 


CCTGCACCAC 


ACAATTGTTG 


GAACGGATAA 


TTAAACGATG 


480 


GATGCATTGG 


ATGTACGATT 


GCATATGCTT 


CTGGTAATGT 


ACTACCAATT 


TCAT 


534 


(2) INFORMATION FOR SEQ ID NO: 358: 








(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3621 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 








(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 358: 






GGTGAGTCAA 


ATTAAATGAA 


TCTAATAAGT 


CATAACTATC 


TATTTGTAAT 


GTGCAACGCT 


' 60 


TAACGCATAT 


ACAAAATGAA 


TGTGCTGATA 


ATGATTTACT 


CAAATTAAAA 


GGTGATTTTT 


120 


ATTCAATGAT 


GAATGAAAGT 


TGCCTTTTTA 


TTTTTGGTAA 


AAGTTAATGC 


GTCAGTGAAT 


180 


TGTGTAAGTT 


TTTCAAAAAG 


TAAAAAGAAA 


TAATAAAGGT 


GAATTATTAG 


AATTCCArAA 


240 


ATAATTCATT 


ACATTCATAA 


AGCATTTTAC 


AAATGGTAAG 


AAAATGAGTG 


TTACAAATCT 


300 


AAATATTGCA 


AAAGAAGCTG 


ATTTAGTCAC 


AAAAAATGTC 


CTATGTAATA 


ATTCGAGAAA 


360 


GATGCACTAT 


ATACGGTCTT 


CTTACTATTC 


AAATGTAAAA 


GTTGCTTATT 


TGCGTGGCTT 


420 


TTTGTTTTAT 


AAAAGTATAA 


AATTTTACTA 


TAATATATCT 


TGTAGAGAAC 


AATGAAATGA 


480 
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ATAGCAAACT GTATTACTTT GATACAAAAA TGGTTGTAAT AAATATTTAT CGATATGACG 600 

ACTTGAATAT GATAAAGTGA CATATTTATG TATATGACTA TTTCGCAAAA TGTAATCGAG 660 

GTAGAATTTC TTGACAATTC TGTCAGTTTA TAAGATGTTA TAAATATGTA GTGTATAAGG 720 

AGGCAAACAA GATGACTGAA GAATTCAATG AATCAATGAT TAACGATATT AAAGAAGGTG 780 

ACAAAGTCAC TGGCGAGGTA CAACAAGTTG AAGACAAGCA AGTTGTTGTT CATATCAACG 84 0 

GTGGTAAATT TAATGGGATT ATTCCTATTA GTCAACTATC TACGCATCAT ATTGATAGCC 900 

CAAGTGAAGT TGTAAAAGAG GGCGACGAAG TTGAAGCATA TGTCACTAAA GTTGAGTTTG 960 

15 ATGAAGAAAA TGAAACTGGA GCTTACATCT TATCTAGAAG ACAACTTGAA ACTGAGAAGT 1020 

CTTATAGTTA TTTACAAGAA AAATTAGATA ATAATGAAAT CATCGAAGCG AAAGTAACAG 1080 

AAGTAGTTAA AGGTGGTTTG GTTGTTGATG TAGGACAAAG AGGTTTTGTT CCGGCTTCAC 114 0 

20 TAATTTCAAC AGACTTCATT GAGGATTTCT CTGTGTTTGA TGGACAAACA ATTCGTATTA 1200 

AAGTTGAAGA ATTGGATCCT GAAAATAATA GAGTCATTTT AAGCCGTAAA GCAGTTGAAC 1260 

AAGAAGAAAA CGATGCTAAA AAAGATCAAT TATTACAATC TTTAAATGAA GGCGATGTTA 1320 

TTGATGGTAA AGTAGCGCGT TTAACTCAAT TTGGTGCATT TATAGACATT GGCGGTGTTG 1380 

ATGGTTTAGT GCATGTATCT GAACTTTCTC ACGAACATGT TCAAACACCA GAAGAAGTAG 144 0 

TTTCAATTGG TCAAGATGTT AAAGTTAAAA TTAAATCTAT TGATAGAGAT ACAGAACGTA 1500 

TTTCATTATC AATCAAAGAT ACGTTACCAA CACCTTTCGA AAATATTAAA GGTCAATTCC 156 0 

ACGAAAATGA TGTCATTGAA GGTGTCGTAG TAAGATTGGC AAACTTTGGT GCATTTGTTG 1620 

35 AAATTGCACC AGGTGTACAA GGACTTGTAC ATATTTCTGA AATTGCACAC AAACACATTG 1680 

GTACGCCAGG TGAAGTGTTA GAACCTGGTC AACAAGTAAA TGTTAAAATA TTAGGTATTG 1740 

ATGAAGAGAA TGAAAGAGTA TCACTATCTA TTAAAGCAAC ATTACCAAAC GAAGATGTTG 1800 

40 TTGAAAGTGA TCCTTCTACG ACTAAGGCGT ACTTAGAAAA CGAAGAAGAA GATAATCCAA 1860 

CAATTGGCGA TATGATTGGT GATAAACTTA AAAATCTTAA ACTATAATTT AATATTTAAT 1920 

AGTCAACTCC ACATGTTTAT GATTGcATGT GGAGTATTTT TATGTAACAA AATATACTCG 1980 

GAATGATAAC GTGGgACAAA TTTAACTAAG TGTTTAAAAA GATArAGTTT TAAGTGCtGa 204 0 

tTTTTATCAT TACAGTAATA AACTCATTTT GAATACACAG TCTCATGTGA TATTATTAAA 2100 

AAGATATaAG AAAGAGAGGA AGTTAGCTTA TGACTAAACC TATAGTAGCT ATTGTAGGTA 2160 

GGCCTAATGT AGGTAAATCT ACAATTTTTA ATAGAATAGT TGGAGAACGT GTTTCGATTG 2220 

TGGAAGACAC GCCAGGTGTA ACACGAGATC GTATTTATTC TTCAGGTGAA TGGTTAACAC 2280 
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AAATTAGAGC GCAGGCAGAA ATCGCCATAG ATGAAGCGGA TGTTATTATT TTTATGGTTA 
ACGTGCGTGA AGGATTGACA CAAAGCGATG AAATGGTCGC TCAAATTTTA TACAAATCTA 
AAAAACCGGT CGTATTAGCG GTTAACAAAG TAGATAATAT GGAAATGCGT ACAGACGTGT 
ATGATTTCTA TTCATTAGGA TTTGGTGAAC CGTATCCGAT ATCAGGGTCA CATGGTTTAG 
GTCTTGGTGA CTTGTTAGAT GCAGTTGTTT CTCATTTTGG TGAAGAGGAA GAAGATCCTT 
ATGATGAAGA TACAATTCGA CTATCCATTA TTGGACGACC AAACGTAGGT AAATCAAGTT 
TAGTAAATGC TATTTTAGGT GAAGATCGCG TTATCGTTTC TAATGTTGCA GGGACAACGA 
GAGACGCTAT TGATACAGAG TATAGTTATG ATGGACAAGA TTATGTTTTA ATCGATACTG 
CTGGTATGCG TAAAAAAGGA AAAGTATATG AATCAACTGA GAAATATTCA GTATTAAGAG 
CTTTAAAAGC GATTGAACGT TCAAATGTTG TTTTAGTGGT CATAGATGCA GAACAAGGCA 
TCATTGAACA AGATAAACGT GTTGCAGGAT ATGCACATGA ACAAGGTAAA GCAGTCGTGA 
TTGTCGTAAA TAAATGGGAT ACTGTGGAAA AAGATAGTAA AACGATGAAG AAATTTGAAG 
ATGAAGTACG TAAAGAATTC CaATTTTTAG ATTATGCACA AATTGCTTTT GTGTCTGCTA 
AAGAACGCAC AAGATTACGT ACATTATTCC CTTACATCAA TGAAGCAAGT GAAAACCATA 
AAAAACGTGT TCAAAGTTCA ACTTTAAATG AAGTTGTTAC TGATGCAATT TCCATGAACC 
CTACACCAAC AGACAAAGGT AGACGTTTGA ATGTCTTTTA TGCAACACAA GTTGCTATAG 
AACCACCGAC ATTTGTTGTA TTTGTTAATG ATGTAGAATT AATGcATTTT TCTTATAAAC 
GCTATTTAGA GAATCAAATC CGTGCCGCTT TTGGTTTTGA AGkTACACCA ATTCATATTA 
TAGCTCGAAA GAGAAATTAA CGATTGGGGG ATAACAATGA CTAAAATTAC CGTTTTTGGT 
ATGGGAAGTT TTGGGACAGC CCTTGCCAAT GTTCTTGCAG AAAATGGACA TGATGTTTTG 
ATGTGGGGTA AAAATCAAGA TGCTGTTGAT GAATTAAATA CATGTCATAC AAATAAAAAG 
TATTTAAAAT ACGCGAAATT A 
(2) INFORMATION FOR SEQ ID NO: 359: 

|i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 64 3 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



2400 
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2520 

2580 

2640 
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(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 359: 
CTTTCGGAAA TTAGGATCnG nGCTATCTTG GCCCCAATTA CCAAGGGAAC TAnTGGCACC 



60 



55 



1243 



EP0 786 519 A2 



AATGCtTCTT TCATCTCCAT GCCCTGTTGC TCATTATTAA TAACACGGTC TATTAACACA 
ATGGCATTTG TTACTACGAT TCCAATTAAC ATTAGCATAC CAATTAAACT TGGTACTGAT 
ATTGTTTCTC CTGTGATTAA TAGTGCAATA ATTACACCGA TAACTGTAAA TGGTAAAGAG 
AATAAAATTG TAAATGGTGC TAGGCCACCT TTAAATGTAA TAACTAGGAT TAAATATACG 
ATAATGATTG CAGCTAACAT TGCAAAGGCT AATTGTGTCA TTGCATTGTT AATATCATCT 
GATGCACCAC CGATATTAAC CTTTACATTA TTCGGTTTAT CCAAATTATT TATTTTAGAC 
ATCACTTGTC GTGTTGTGCC ACCCACATCT TTATTTGTTA CTTTAGCAGA TACCGTCGTT 
GCATAATCTC CTTGTTCTTG CGTCAATTTA CTTGGTGTCG TTGTTTTAAC TAACGTAGCG 
ATATCTCCCA ATTTAATCGT ACCACCAGTC GGCTTTTTCA AAG 
(2) INFORMATION FOR SEQ ID NO: 360: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2524 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 360: 
TTTCAGGCyG TGCAAGGGCT TTTTCTTTTG CTTTTAAGAT TATGATTTAT CGTGCAAAGT 
TAAGTGGTCG TATATAGTTT TAGTTTTAAA AAGGTAATTA AATAAAATAG TTTGCCGAGG 
GAGATGTCAA AATGATTAAA ATACCTAGAG GGACGCAGGA TATTTTACCT GAAGATTCAA 
AGAAATGGCG TTACATTGAA AATCAATTAG ATGAATTAAT GACATTTTAT AATTATAAAG 
AAATAAGAAC ACCAATTTTT GAAAGTACAG ATCTTTTTGC AAGAGGTGTT GGTGATTCAA 
CCGATGTCGT ACAAAAAGAA ATGTATACAT TTAAAGATAA AGGCGATAGA AGTATTACAT 
TAAGACCTGA GGGAACAGCT GCAGTTGTGC GTTCATATAT TGAACATAAA ATGCAAGGTA 
ATCCAAACCA ACCAATTAAA CTTTATTACA ATGGACCGAT GTTTAGATAT GAACGTAAGC 
AAAAAGGACG CTATCGTCAA TTTAATCAAT TTGGTGTAGA AGCTATTGGT GCTGAAAATC 
CTAGCGTAGA TGCAGAAGTA TTAGCTATGG TTATGCATAT TTATCAATCA TTTGGATTAA 
AACATTTAAA GCTTGTTATT AATAGTGTAG GGGATATGGC GTCTCGAAAA GAATATAACG 
AAGCGTTAGT GAaACACTTT GAACCAGTAA TTCATGAATT TTGTTCAGAT TGTCAATCAC 
GTTTGCATAC AAATCCGATG CGAATTTTGG ATTGTAAAGT AGACCGTGAT AAAGAAGCGA 
TTAAGACTGC ACCTAGAATC ACTGATTTCT TAAATGAGGA ATCTAAGGCA TATTATGAAC 
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GTGGATTGGA TTATTATACA CATACAGCAT TTGAATTAAT. GATGGATAAC CCTAACTATG 960 

ATGGTGcCAT TACAACGCTT TGTGGTGGTG GCCGTTATAA TGGTTTATTA GAATTGCTAG 1020 

ATGGTCCAAG TGAAACAGGT ATTGGTTTTG CGCTAAGTAT AGAACGATTA TTGCTTGCAC 1080 

TTGAAGAAGA AGGTATCGAA TTAGATATTG AAGAAAACTT AGATTTATTC ATTGTTACAA 1140 

TGGGTGATCA AGCAGATCGA TATGCTGTGA AGCTATTAAA TCATTTGAGA CATAATGGTA 1200 

TTAAAGCAGA TAAAGACTAT TTACAGCGTA AAATTAAAGG ACAAATGAAA CAAGCAGACC 1260 

GTTTAGGTGC CAAGTTTACA ATCGTTATTG GTGATCAAGA ATTAGAAAAT AATAAAATCG 1320 

ATGTTAAAAA TATGACAACT GGTGAATCTG AAACAATTGA ATTAGACGCA TTAGTCGAAT 1380 

ATTTTAAGAA GTAGAGAGGG CGTTAAAATA TGAGTAAGAG AACAACTTAT TGTGGATTAG 144 0 

TTACTGAGGC ATTTTTAGGA CAAGAAATTA CATTAAAAGG ATGGGTTAAC AATCGTCGTG 1500 

20 ACCTTGGTGG ATtGATTTtC GTTGATTtAA GAGATAGAGA AGGAATTGTA CmAGTCGTGT 1560 

TTAATCCTGC ATTTTCAGAA GAGGCaTTGA AAATTGCTGA AACAGTACGT TCTGAATATG 1620' 

TTGTAGAAGT TCAAGGTACA GTTACGAAGC GTGACCcTGA AACAGTTAAT CCTAAAATTA 1680 

25 AAACTGGCCA AGTTGAAGTA CAAGTTACAA ATATTAAAGT GATTAATAAA TCTGAGACAC 174 0 

CACCATTTTC TATAAATGAA GAAAATGTTA ACGTTGATGA AAATATTCGA TTAAAATACC 1800 

GTTATTTAGA TTTACGTCGT CAAGAGTTAG CGCAAACATT TAAAATGAGA CATCAAATTA 1860 

CACGTTCTAT TCGTCAATAT TTGGATGATG AAGGGTTCTT TGACATCGAA ACACCAGTAC 1920 

TAACGAAGTC AACACCTGAG GGTGCACGTG ACTATTTAGT ACCATCTCGT GTTCATGATG 1980 

GTGAATTTTA TGCATTACCA CAATCACCAC AATTATTTAA GCAATTATTG ATGATTAGTG 204 0 

GATTTGACAA ATACTACCAA ATCGTAAAAT GCTTCCGTGA CGAAGATTTA CGTGCAGATC 2100 

GTCAACCTGA ATTTACACAA GTCGATATTG AAATGAGTTT TGTAGACCAA GAAGATGTGA 2160 

40 TGCAAATGGG TGAAGAAATG CTTAAAAAAG TTGTTAAAGA AGTTAAAGGC GTTGAAATTA 2220 

ATGGCGCTTT CCCACGCATG ACATATAAAG AAGCGATGCG TCGCTATGGT TCTGATAAAC 22 80 

CAGATACACG TTTTGAAATG GAATTAATTG ACGTTTCTCA ATTAGGACGT GATATGGACT 234 0 

TTAAAGTATT TAAAGATACT GTTGAAAATG ATGGTGAAAT TAAAGCAATT GTCGCTAAAG 24 00 

GTGCAGCTGa ACAATATACT CGTAAAGaTA tGGGaTGCTT TAACAGAATT TGTaAACaTC 24 60 

ymTGGtGCTA AgGtTAGCGT GGGGTTAAAG TTGTGGGAAG GTGGTTTTGA CAAGGTCCCA 2520 

ATGG 2524 
(2) INFORMATION FOR SEQ ID NO: 361: 
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(A) LENGTH: 1507 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 361: 
TCGTTGAGTA AAAGTCCAGA AAATTGGATG AGTAAACTTG ATGATGGAAA ACATTTAACT 
GAGATTAATA TACCGGGTTC ACATGATAGT GGCTCATTCA CTTTAAAGGA TCCAGTAAAA 
TCAGTTTGGG CAAAGACTCA AGATAAAGAT TACCTTACCC AAATGAAGTC GGGAGTCAGG 
TTTTXTGATA TTAGAGGTAG AGCAAGTGCT GATAATATGA TTTCAGTTCA TCACGGCATG 
GTTTATTTGC ATCATGAATT AGGAAAATTT CTCGATGATG CTAAATATTA CTTGAGTGCT 
TATCCAAACG AAACAATTGT GATGTCTATG AAAAAGGACT ACGATAGCGA TTCTAAAGTT 
ACGAAGACAT TTGAAGAAaT TTTTAGAGAA TATTATTATA ATAACCCGCA ATATCAGAAT 
CTTTTTtACA CAGGAAGTAA TGCGAATCCT ACTTTAAAAG AAACGAAAGG TAAAATTGTC 
CTATTCAATA GAATGGGGGG TACGTACATA AAAAGTGGTT ATGGTGCTGA CACGTCAGGT 
ATTCAATGGG CAGACAATGC GACATTTGAA ACGAAAATTA ATAATGGTAG CTTAAATTTA 
AAAGTACAAG ATGAGTATAA AGATTACTAT GATAAAAAAG TTGAAGCTGT TAAAAATTTA 
TTGGCTAAAG CTAAAACGGA TAGTAACAAA GACAATGTAT ATGTGAATTT CTTGAGTGTA 
GCGTCTGGAG GCAGCGCATT TAATAGTACT TATAACTATG CATCACATAT AAATCCTGAA 
ATTGCAAAAA CGATTAAAGC AAATGGGAAA GCTAGAACGG GTTGGCTGAT TGTTGACTAT 
GCAGGATATA CGTGGCCTGG ATATGATGaT ATCGTAAGTG AAATTATAGA TAGTAATAAA 
TAAGGATTCA ATAATGATAT TAAGACGAGT ATGAAAATAG TTAGATTCTA ATTATTTTCA 
CTACTCGTTT TTATTTTGAA AATAAGTAAT AATTCAACAA TATTATAAAT TGAACAGATT 
GTTTGTGAAA TTTTTGATAA TATTAAAGTG AAAAAGTGTT ATAAATTGAT AAATATATGT 
AATTAACAAA AACAAATCAT TTTAAAAAGA AGAGAGTTGT AAGATGATGa AACGATTAAA 
CAAATTAGTG TTAGGCATTA TTTTTCTGTT TTTAGTCATT AGTATCACTG CTGGTTGTGG 
CATAGGTAAA GAAGCGGAAG TTAAGAAAAG CTTTGAAAAA ACATTGAGTA TGTACCCTAT 
TAAAAATCTA GAGGATTTAT ACGATAAGGA AGGCTATCGT GATGATCAGT TTGATAAAAA 
TGATAAAGGT ACATGGATTA TAAATTCTGA AATGGTTATT CAACCTAATA ATGAAGATAT 
GGTAGCTAAA GGCATGGTTC TATATATGAA TAGAAATACC AAAACAACAA ATGGTTACTA 
tnTATGTCGAT GTGACTAAGG ACGAGGATGA AGGAAAACCG CACGACAATG AAAAAAGATA 
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(2) INFORMATION FOR SEQ ID NO: 362: 

(i) SEQUENCE CHARACTERISTICS: 
5 (A) LENGTH: 1216 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

10 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 3 62: 

TACATGTTTC GGATGCTACT TTATTTAGTT TGAAGGGTGC ATTATGGACG TTAGCGCAAG 60 

, 5 AAGTTTATCA AGAATGGTAT TTAGGATCGA AGTTGTATGA AGATGTTGAA AAGAAAATAG 120 

CACGAACTAC TTTTAAGACA GGTTATATTT ATCAAGAAAT TATTTTGAGA CCAGTAGATG 160 

AAGTTAAGGT ACTTCTGAAT GATTTAAAAG GTGCTGGTTT CGAATTAGGT ATTGCAACAG 240 

20 GTCGTCCTTA TACTGAGACT GTTGTGCCAT TTGAAAATTT AGGATTGTTA CCATATTTTG 300 

AAGCTGATTT TATTGCAACA GCAAGTGATG TTTTAGAAGC AGAGAATATG TATCCGCAAG 360 

CACGACCATT AGGAAAGCCG AATCCTTTTA GTTATATCGC AGCTTTATAT GGTAATAATC 420 

GCGATAAATA TGAATCTTAT ATCAATAAGC AAGATAACAT TGTAAATAAA GATGACGTAT 4 80 

TTATAGTAGG CGATTCGTTA GCTGACTTAT TAAGTGCTCA AAAAATAGGT GCAACGTTTA 54 0 

TTGGAACATT AACAGGTTTA AAAGGTAAGG ATGCTGCAGG TGAGTTAGAA GCGCATCATG 600 

CCGACTATGT TATTAATCAT TTAGGTGAAC TTAGAGGTGT ACTAGATAAT TTGTAATTTG 660 

ATTGTTGTTT GACAGCATAA CTTGTAGTGA ATGATTGAAC CAAAGGTTTC ATATTGAGTT 720 

ACAATGAAAT TAATAATGAA AAAATGCCAA GAAGCAATGG AAGTAATCCA ATGTCTTCTT 780 

GGCATTTTGA ATTTACATAA ATTGTTTATG ACTGTACCGT CAATTCAGTT GTGAAAATTT 840 

GATTGTATTC ACCAACTTGT TTAAGTTCAT CAATTATATT GTTTGAAACA GGTTGATCAA 900 

40 CGGATAAAAT CATTAGCGCA TCTCCGCCCG CTTCAGTTCT ACCTAAAGTC ATAGATGCAA 960 

TGTTGATATT GTATTTACCT AACAATGCGC CAGTTTTTCC TACCATACCT GGAGTATCAT 1020 

TATGATATGA CACAATTTGA TATTGATTTG GCTTTAAGTC TACAGAAAAA TTATTAATTC 1080 

45 . TAACAATTCT TGGACCGAAA CCTGTAAAGA CAGAAGCGCC AACTTTAACG GAATCGCnAT 114 0 

CGnTTGATAG TTCTACCTCT AAGTAGTTAC TAAAACCTGT CTCTGCTTTA TTATTTTCAA 1200 

TATTTAATGT CACTTG 1216 

SO 

(2) INFORMATION FOR SEQ ID NO: 363: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 867 base pairs 
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(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 363: 
ATCAAAATAT TTTAAATAAT ATTGATGGTC ACATTGTAAA TrmAATAGAA AATAAATTTG 
ATCAAATATT ACAAGAACCA TTAAATCCAT TAAATTATGA TACTGTCAGT GGATTAGCTG 
GGATAGGGAG ATATTTGCTA AATAGAGTAG ATGAGAATGA ATTTAATGTT AAAGCATTAA 
AAAGCATATT AGTATACTTT AAAGATATTC AATATTCTAA AAATAGCTGG GTAGTCCCAC 
AAGArAGTCA ATTTTTAGAG TCTGATAAAA ATTATTTTAC TGAAGGTAAT ATCAATCTTG 
GCCTTGCACA TGGaGTGCTA GGACCGATGT CTTTATTTGC ATTATGCGTG ATTAAAGGAA 
TTACGATTGA AAATCATCAG CACATATTAA AAGACATGTA CAAATTTATC. ATGGACGAAA 
AATTTTGTAA CCACGAAAGA TGGTTGCAGC GTTACGATTT AATTTCTGAA CGTAATCATT 
TCAATTTTAT TCGGAATGGT TGGTGTTATG GCAATACGGG TGTAATGACG ACGTTGTTTT 
TAATCGGCCA AGCATTACAA GATGATGAAA TAATTAAAAT GTCTAAAAAA GTGATGCTAC 
AAGTAGTAAA TGATAAAGAT GAAAATTTAA TAAGTCCAAC TATTTGTCAT GGATTGTCAT 
CACAAATATT AATGTTAACA ATTATGAATT TGAATTTTGA ATTAAATGAA GTGTCTGATT 
ATATCACTGT ATTAATAAAT AAACTGATTT CTCATTATAA GGAAGATTAT CTGGTGAATT 
TTATAGACAT TAATGAAAAT AAGCAAGATG TATTTAAAAG TAGG AAAGTT GGCCTTTTAG 
AAGGTGAATT AGGGGTCATC TAACATT 
(2) INFORMATION FOR SEQ ID NO: 364: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 10813 base pairs 

(B) TYPE: nucleic acid 
{C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 364: 
TACCTTTTCT TtTAAATCAT TTTATATTTT CCCaCTAATA TCCGcTGtTA ATCaATCCtG 
ACATCCtTGT ATCaCTATGA CAATTAATTG TTAAATACAT GAATTTCTAC ATTTTATGAA 
AAAATCCATT TTTATTACAA TTCAACACTT TATATGACAA CTTCATTACA GTTACTTTTA 
TTGTTGATTG CTTACATTGT TTTCTAAAAA AAATTTGTTA TCATAATTAA CGTTGAATAA 
AGAAAAAAAT TAACTTGGGA GATAAAAATG GAATATAAAA AGATACTAAT TCGTTTATTA 
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CAATCGCATG CCGCAGTTAA TTATTATAGT AAAAACCAAT GTACATGGTG GGCATTTAAA 420 

CGTCGCGCAC AAGTCGGTAA ACCTGTTTCT AATAGATGGG GCAATGCTAA AAATTGGTAT 480 

5 

TACAATGCAC GTAAATCAAA ATATGCGACT GGTCGTACAC CAAGAAAATT TGCTGTCATG 540 

CAATCAACTG CAGGATATTA TGGACATGTC GCAGTTGTTG AACAAGTATA TAAAAACGGT 600 

AGTATTAAAG TTTCAGAATA CAACTTTTAT CGCCCATTAA AATACAATAC ACGTGTACTA 660 

10 

AGCAAAAAGG CAGCACGTAA CTTTAACTAT ATTTACTAAT CAAAAAACTT CTATCACGAA 720 

CGCTTCAATT TCCTGTATGC GTGTGATAGA AGTTTTTATT TTATGAAATT ATATTATTAC 780 

is TTCTACAAAT TTCAAATTGC CGTAATTGAA CGTATATTTC TTCTTCAACT ATTATTTCAT 840 

CTTTAGCATA ATCTATATAT AAAATTTTAT GCTATTATTT AAATAATTCG CTATAACTTA 900 

ACATACGTTT TCGATATAAA CCTTGTTCTA AATCTCAATA ATTTTTTGCT GTTTTCATCG 960 

20 TCATTAGTTA AAAAAATAAT TTAACTGAGT TTTTGAGACC TGTTTAAATT GATGACTCAA 1020 

AACCTTTATC CCCTTTTCAC TCGGTTTAAT TGCTTTAATA TTTAACACAG TCTCATTGTA 1080 

ATTTTGCTAC TAAGTTTGAA ATATTTCGAT TCGAATGTGA AcATCATTTA TTATTACTTT 114 0 

25 CGACAGCTAG AAAAATATTG TTAAACCAAA ACTATAATTA CCACTTTTAT ATAGAACTAT 1200 

ATATAAATTT TAACTTTGAG ACAGAACTGC TAGTCAGGTT TATGAATATA TTTCTTTAGT 1260 

TTACTTGaTA TACTTATTGG TAAATCATTA TTTATTTGAA GAGCATTTAT AACAAAAAGT 1320 

30 

ATAATCCCAG TTATAGCGAT TCCATGACCA TTTTTATCAG TCAAAGATTC ATCAACAAAA 1380 

ACTTTTTGAT AAATTTATAT ATTTGTATAA TTTATTATGG TAGATATCTA CACCCGTATC 144 0 

TATAACAGCT ACAGTTATCA TTGCGTCTTA TCCAAATAGT TTTTAAGAAA TAAATATAAT 1500 

35 

TCATTAATAT CATGGCTATT TGTAACGTCA GtGCTTaAGA CCTTGTCAAT TATTGTTTTA 1560 

TCTGTTTCTA AGAGCCCCTG ATTTTCTGCA TACATATTTT GTATATCGCT GTTAATCTCA 1620 

40 TTTAATTTTT TAAATTTTTT TCTAACCTTT TTCAAAATAA AATGCTCTTT AATTCCATCT 1680 

CTTAAATACA TATAAATCTC TATTATAATC TCCATAAATG TCATATCTCC TCTCTCAAAA 174 0 

AACATTATAC TCAATATATT AAAAATAAGA AAGGTTTTTT CAGAATTTTT AGTATTTTCA 1800 

45 GATATTTATT CTTAAGTATC TTATTATTAC TTCTTTTTAA CGCTAGTGGa ATAATTAATA I860 

ATAATTGTAT TTAAATGCAA TGCTGTTGTT CTTTCATACT TACAAGCAAG TCATAAGAAA 1920 

TGAGAAATTA AATTCTTATA TGATGAATAA ATGATGACTG CAGAAGAAAT TGCTAAAAAA 1980 

50 GGAGTGGAGT GAGGCATTCT ACTGTTCATA TTGTTAACAA ATATCAAAAT GATAGGAACT 204 0 

TGAAGAATCT AAGACTGTTA AAATCGAGAC AAGAAGAAAC TCGTTCCAAA TTTGAATCCT 2100 
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AAAACTTCTA TCACGAACGC TTCAATTTCC TGTATGCGTG TGATAGAAGT TTTTATTTTT 2220 

GTTCATATTA ATTTATCTAA GCGCTACGAT GGaCTGACTT AAACTTTTCT TTAAAATCGC 2280 

5 

TATTCGCCAT TTACTATTGT TGTCTAATTT CTTGTAAAAT ATGTTCCGCT GCTTGTGTAT 2340 

TTGCACGGGG TTCTTTTTTC AAAGCTTCAG CTACTTTAGC AATTTCATCA CCTTTTGCCC 2400 

CTACAACGAT AGCTAATGAT TTATATTGTA AACTCATATG ACCTTGTTGA ATACCTTCTG 2460 

10 

ACACAAGCGC GCGACATGCT GCAAAGTTTT GCGCTAAACC AACGGCAGCA ACTACATGAC 2520 

CTAATTCTTG TGCTGACTCT ACATTTAGTA GCTCTAATGA AGCTTTAGCA ATTGGTAATA 2580 

,5 CTTTTGTACC ACCGCCAACG ATTGCCAATG TCATAGGCAC TTCAATTGTA CCAATCAATC 2640 

GTTGACGATC TTGATCGTAA CGCCATGTAG CAATACCACG ATACTGTCCG TCACGACTCG 2700 

CGTATGCATG CGCACTTGCT TCTGCACCAC GCGTATCATT TCCTGTTGCT AAAACAACAG 2760 

20 CATGTATGCC ATTCATAACA CCTTTATTAT GTGTTGCTGC ACGATGAATA TCTACTTGGG 282 0 

CCAATACAGA AGCACGTTCC ATTCGTTTGG CAACCTCTTC TCCAGTTCTC TCGCCCCTTG 2880 

CTAAATCTTT AACATCAATT TCGCCTTGAA CTTTAACAAC GGACGCTGTT GCATGATTGG 2 94 0 

25 ATAAAATACT CATTAAAATG TCGCTTTGCG GAAATTCATT TTTTAAAAAT GCAGTTATGG 3000 

CCTCTAAAAT CGTATTAAGC ATATTAGCGC CCATAGCATC TTTCGTATCA ACAAATACTT 3060 

TTAAAGATAG TAACTGTTGC TCAGGAAATG TATCAATCGC TATACGTTGG TAACCACCAC 3120 

30 

CACGCGCTTT AATAGAAGGA TATGCCTCAT CCGCAATTTT ATGAATTTGC TTTTCTAAAG 3180 

CTTTAATGTC TGCTGATAAT TTTTCAGTAT CGTCAACGCC ATCAAAGACG ATTTGACCTA 324 0 

TCATAATACG TTCAGAAGAT ACCGTTTTAA ATCCGCCAGT CTGATTCACT AGCTTTGCAC 3300 

35 

CATAACTAGC TGCAGCGACA ACTGAAGGCT CTTCCACCAT CATAGGTACA ACATATGCCT 3360 

TATCGTCCAC AATGATATTC GGTAATAATC CAACGGGTAA TGCACCTTGC GCGATGACAT 3420 

40 TTTCAATTAA ACTATTGGCT ACTTCTTCAT CGATTAATGG ATGATTCAGT AAAATGTCGA 3480 

ATTGTTCTTC TGATAACCAT TGCTTATCAA CCAATTGTTG TAACTTTTCT TTACGAGATA 3540 

AATGTCGAAA ATTCTTATCT AAATTTTGCA TGGACGTACT CCTTTTACTT CACATAATTT 3600 

45 TTAACATTTC AATCACTACT ATTTTTACCA CAAAATAACG TCATTCGTCT TAAAATTCAA 3660 

TTGAATAATT GTCGTTTTGA CTTTAAAATA AAACAAGGTA AATTAAAACG CTTACAAGAA 3720 

ACGACAAATc ATTTTTAAAT TTAGTATATT TCTTTGTATA AAATTAGCAT ATTCTGATAT 3780 

SO 

GATACAAGTG TTGCTTTTAT AAATTTGAAA GGATGTAAAA CCTTATGACA ATAGGTATCG 384 0 

ATAAAATAAA CTTTTACGTT CCAAAGTACT ATGTAGACAT GGCTAAATTA GCAGAAGCAC 3900 
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CTGTAAACCA AGACATCGTT TCAATGGGCG CTAACGCTGC TAAGGACATT ATAACAGACG 


4020 


AAGACAAAAA 


GAAAATTGGT 


ATGGTAATTG 


TGGCAACTGA ATCAGCAGTT 


GATGCTGCTA 


4080 


AAGCAGCCGC 


TGTTCAAATT 


CACAACTTAT 


TAGGTATTCA ACCTTTTGCA 


CGCTGCTTTG 


4140 


AAATGAAAGA 


AGCTTGTTAT 


GCTGCAACAC 


CAGCAATTCA ATT AG CT AAA 


GATTATTTAG 


4200 


CAACTAGACC 


GAATGAAAAA 


GTATTAGTTA 


TTGCTACAGA TACAGCACGT 


TATGGATTGA 


4260 


ATTCAGGCGG 


CGAGCCAACA 


CAAGGTGcTG 


GCGCAGTTGC GATGGTTATT 


GCACATAATC 


4320 


CAAGCATTTT 


GGCATTAAAT 


GAAGATGCTG 


TTGCTTACAC TGAAGACGTT 


TATGATTTCT 


4380 


GGCGTCCAAC 


TGGACATAAA 


TATCCATTAG 


TTGATGGTGC ATTATCTAAA 


GATGCTTATA 


4440 


TCCGCTCATT 


CCAACAAAGC 


TGGAATGAAT 


ACGCAAAACG TCAAGGTAAG 


TCGCTAGCTG 


4500 


ACTTCGCATC 


TCTATGCTTC 


CATGTTCCAT 


TTACAAAAAT GGGTAAAAAG 


GCATTAGAGT 


4560 


CAATCATTGA 


TAACGCTGAT 


GAAACAACTC 


AAGAGCGTTT ACGTTCAGGA 


TATGAAGATG 


4620 


CTGTAGATTA 


TAACCGTTAT 


GTCGGTAATA 


TTTATACTGG ATCATTATAT 


TTAAGCCTAA 


4680 


TATCATTACT 


TGAAAATCGA 


GATTTACAAG 


CTGGTGAAAC AATCGGTTTA 


TTCAGTTATG 


4740 


GCTCAGGTTC 


AGTTGGTGAA 


TTTTATAGTG 


CGACATTAGT TGAAGGCTAC 


AAAGATCATT 


4800 


TAGATCAAGC 


TGCACATAAA 


GCATTATTAA ATAACCGTAC TGAAGTATCT 


GTTGATGCAT 


4860 


ATGAAACATT 


CTTCAAACGT 


TTTGATGACG 


TTGAATTTGA CGAAGAACAA 


GATGCTGTTC 


4920 


ATGAAGATCG 


TCATATTTTC 


TACTTATCAA 


ATATTGAAAA TAACGTTCGT 


GAATATCACA 


4980 


GACCAGAGTA 


GTCGGTGTAT 


TTAAAACACA 


TATAATAAAA CCTAAAAGCA 


GCAGTAAGAC 


5040 


CACTTCTAAT 


TGAAATCGTC 


TTACTGCTGT 


TCTCTATTTA TAACACTTCG 


TATTGAATGA 


5100 


ATTCATTATG 


CCTATTTGAC ACATTATTGA AGTTTTCCTA ATGCCTGGAT CCTTTATACG 


5160 


TTACGGCTTC 


GTGCTATGTT 


TTGGTACATA 


AAGCTTTGAC ATATCGATAT 


TCTCCAACTC 


5220 


TAACAGCTTA 


ATTTTATTAT 


TAATCGTTCC 


ACCGAACCCT GTTAAGCTAC 


CCGTTTTACC 


5280 


GACAACACGA 


TGACATGGCA 


CGATAATAGA 


TAATGGATTA CTTCCGACTG 


CACCTCCAAC 


5340 


CGCTTGGGCT 


GACATTTTTG 


GCTTGTTAAG 


CAGCTTGCCT ACTTTTTTGG 


CAATAGCACC 


5400 


ATACGTTGTT 


AGAGTCCCAT 


AAGGAACCTG 


TCTTAATTCA TTCCAAACAC 


ACTGTTGAAA 


5460 


ATGACTACCT 


GTTGGCTTTA 


AAGGTATTGT 


GATTTCAGGA TTGTCACCTT 


TAAAATACGC 


5520 


GTCTAACCAC 


TGTGTCGCCT 


CTCTAAATAT 


CGCTAAAGAC GTATTTTCTT 


CCCTAGTACC 


5580 


ATCACCTTGT 


TGATTTTCAA 


ACAAAACAGC 


GGTCAGACTT ACCCCATCAC 


TCAAAAGTTC 


5640 


CAATCGTCCT 


ACAGGCGAAT 


CATAGTAACT 


CTTATACTCC ATAAAAATTC 


CCCCTTTTTC 


5700 
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ATAAGTCGTC AATTACGTAT ATAAACACGT AATACCAGCT ATCACTTTGC TGCAATATAC 5820 

AGTTACATAT CTTACTACAC GTGCTAACCT CTTACTTTGT AAACCAAATC TTAAATTAAA 5880 

5 

ATATTGAAAA TGCAATGAAT CCTTAATATT TTATTAAACC TATAATTACT TATTAAAAAT 5940 

AACACACAAT ATTCATAAAG TTTTAAAAAT ATTCTGTTTT ATCACCTACT ATTAGTGGAA 6000 

AAGTACAATT GCAATTGTAT ATAGTTTGCA TAACGCTTCA AAAGTAATTT CTTTTTTGTT 6060 

10 

TAGTTCAAAA AAATTTAGAG GTGATGTTAT ATGAATAACG GTTTTTTCAA TAGCGACTTT 6120 

GATTCAATTT TTCGAAGAAT GATGAAAGAT ATGCAAGGTT CAAATCAAGT CGGAAACAAA 6180 

75 AAGTACTATA TTAATGGTAA AGAAGTTTCA CCTGAAGAAC TAGCGCAACT CACACAACAA 6240 

GGTGG CAATC ACTCTGCTGA ACAAAGTGCG CAAgcTTTTC AACAAGCAGC ACAAAGACAA 6300 

CAAGGGCAAC AAGGTGGCAA CGGCAATTAT TTAGAACAAA TTGGTCGTAA CCTTACGCAA 6360 

20 GAAGCACGTG ACGGTTTATT AGATCCAGTC ATTGGTCGTG ATAAAGAAAT TCAAGAAACT 6420 

GCTGAAGTTT TAAGTAGACG AACTAAAAAC AATCCTATAT TAGTTGGAGA AGCTGGTGTT 6480 

GGTAAAACTG CGATTGTTGA AGGTTTAGCA CAGGCAATCG TTGAAGGAAA TGTACCAGCA 6540 

25 GCAATCAAAG ACAAAGAAAT TATTTCTGTA GACATTTCAT CATTAGAAGC TGGAACGCAA . 6600 

TATCGTGGTG CTTTTGAAGA AAATATTCAA AAATTAATCG AAGGTGTTAA ATCTTCACAA 6660 

AATGCCGTAC TATTCTTTGA TGAAATCCAT CAAATTATCG GTTCAGGTGC CACAGGAAGT 6720 

30 

GATTCAGGTA GCAAAGGGTT ATCTGATATT TTGAAACCTG CATTAAGTCG TGGTGAGATT 6780 

TCTATTATTG GTGCAACAAC ACAAGATGAA TATCGAAACA ATATTCTTAA AGATGCTGCA 6840 

TTAACGCGCA GATTTAATGA AGTGCTTGTT AATGAACCAA GCGCTAAAGA TACTGTTGAA 6900 

35 

ATTTTAAAAG GTATTCGCGA AAAATTCGAA GAACACCATC AAGTAAAATT ACCAGATGAC 6960 

GTATTAAAAG CATGTGTTGA CTTATCAATT CAATATATTC CACAACGATT ATTACCAGAT 7020 

40 AAAGCAATCG ATGTGTTAGA TATTACAGCA GCACATTTAT CTGCGCAAAG TCCAGCTGTC 7080 

GATAAAGTTG AAACTGAAAA ACGAATTTCT GAATTAGAAA ATGATAAACG TAAAGCAGTA 7140 

AGTGCTGAAG AATATAAAAA AGCTGACGAC ATTCAAAATG AAATCAAATC ATTACAAGAT 7200 

45 AAATTAGAAA ATAGTAATGG TGAACATACT GCTGTTGCTA CAGTTCATGA TATTTCAGAT 7260 

ACTATTCAAC GATTAACTGG TATTCCAGTT TCTCAAATGG ATGATAACGA TATTGAACGT 7320 

TTAAAAAATA TTTCTAATCG TTTAAGAAGT AAAATCATAG GTCAAGATCA AGCTGTAGAA 7380 

50 

ATGGTTTCAC GTGCAATTCG CCGTAATCGT GCTGGGTTTG ATGACGGCAA CCGTCCAATT 7440 

GGCAGTTTCC TATTTGTTGG CCCTACTGGT GTTGGTAAAA CAGAGCTTGC TAAACAATTA 7500 
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GACACAACAG CTGTTTCAAA AATGATTGGT 
AATTCAAATA CGTTAACTGA AAAAGTACGC 

5 

GAAATCGAAA AAGCAAATCC ACAAATTTTA 
AATTTGACTG ATGGTCAAGG TAATGTCATC 
TCAAATGCTG GCTTTGGCAA TGGCAATGAC 

10 

AAAAAATTCT TCCGCCCTGA ATTCCTTAAC 
TTAGATAAAG ATGCATTGCA AGATATCGTC 

15 TTAGACAAAA AAGGTATTAC GATGGACGTT 

GAAGGCTATG ATGAAGAATT AGGTGCACGT 
CGTGACAAAA TTACAGATTA CTATTTAGAT 

20 GTTGAGGATA ACGAATTAGT CGTAAAAGGT 

AAAAATGAGC ATCAGGTCGC CCTTGCCTGT 
TGATTCGCTG TGTGCTGTTC TGTTCCACAA 

25 TTTCCTTGTT TTGAACGCTT GAAAAATTTT 

GCTAAAAAAA TTAAAATGTT AATAATGACT 
TGTCCGACTT GATAAAAAAT GAATGTTAAG 

30 

GCAAGTGCCG TCCATTTCCA TGAATAAGTC 
CAAGGAATAT ACAATAGTAT AAATATCATA 
TTTTGAATCA CATTAACAAG GCCTGCATCA 

35 

ACGATAACTT CTTTTGCTAA AAATCCTGGC 
AATCCGAGCG GTTGCACTAA CATACCAAAG 
TTGATATTCA CATTGATACC ATGTGGTCCT 

40 

CCGCCAAAAA TAAATGTACC TGCTTTACGA 
CGCCACAACG TTTTAATGGA AGGCACACGG 
45 TTATCATTTT TTAAAATCGT CTTAGTAAGT 

CCTAAAACAT ACAGGCTTAA TACTACTAAA 
AACAACGCAT ACACTGGCAG TCTAGCAGAG 

50 

GTTAAACGCT CTTTTTCATT TTCAATACTG 
CCAAATCCGA TAATCATTGG TATAAAAGAC 

55 



ACAACTGCTG GTTATGTTGG TTATGATGAC 7620 

CGTAATCCAT ACTCAGTCAT TCTATTTGAT 7680 

ACATTGTTAT TACAAGTAAT GGATGATGGT 7740 

AACTTTAAAA ATACAATTAT TATTTGTACA 7 BOO 

GCTGAAGAAA AAGATATTAT GCACGAAATG 7860 

CGCTTCAACG GCATCGTTGA ATTCTTACAT 7920 

AACTTATTAT TAGACGATGT ACAAGTTACA 7980 

TCTCAAGATG CGAAAGATTG GTTAATTGAA 8040 

CCATTAAGAC GTATTGTTGA ACAGCAAGTA 8100 

CATACAGACG TTAAACATGT GGATATAGAT 8160 

AAATAACGAC ACTTTAACAT ATCGCGCATC 8220 

GCTCATTTTT TTAATTATTT CCCTGGAAAA 82 80 
CAATCACGAT TAATGTCACA TGTACCACAT . . 8340 
ACTAGTGTAT ATAAGGCATA TCCGAAAATT * 84 00 

GACACTTTAA CCACTCCTTA AACAAATAAA 84 60 

ACATATGCAG TGACTAGAGG ATAGGCAACT 8520 

TCTTTACGGA TTGCTGCTAC TGTAGAAACA 8580 

AATGCATACG CAGATAGCGG TGTGAATTGA 8640 

CCTGATGAAT AGATAATCGC CATCGAACTT 8700 

AcTAACGTAG CACCTGCTTG CCATGTTCCA 8760 

AAACTACCAA CCATATGTAA AAAACTTTGA 8820 

ACATAACTTA ATAGCCAAAT GACTACTGAG 8880 

ACAAAGCCCT TAGCCTTTTC CCAAGTACTA 8940 

TATGTTGGCA ATTCCACAAT AAAGATTGCA 9000 

ACTGTACTGA CTAAAAATGC CATAATAATA 9060 

GATTGATTCT CTTTGAAAAA GATACCTACG 9120 

CATGACATGA ATGGTGCAAT TAATATCGTT 9180 

CGCGCAGCCA TAATACTCGG TACATTACAA 924 0 

TTCCCGCTTA AACCGAACGA TTCCATAATA 9300 
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AAAAAGAGCA CAACAATTTG TGGTACAAAG ACTAATACTG ATCCTACACC AGCAATAATG 9420 

CCATCTGTAA TTAAATCTTG TAAAAATGGT ATAACACCAA GATAATTCAT AATCGTCTTC 94 80 

5 ACACTATCTG TAAATGTACC ACCTATAAAT GCATCGAGTT GATCCGACAA AGGTGTGCCA 954 0 

ATCCATGTAA ATGTAGTTTG AAAGATCAAC CACATAATTG CTAGAAAGAT AGGCATCCCT 9600 

ATATATTTAT GTGTTAATAT CTTGTCTATT CTAGAGCTGA AATATTGCTT ATCTTCATCT 9660 

10 

GGATACGTTA CCACGTCTTG CAATAACGTC TCAATATAAT GATTGCGTAT ACGCTCCATC 9720 

TCTCGACGAA CAGATACAGC CCCTACTTGT TCAGCAACTT GATCACGTAA ACTCGACAAT 9780 

TTATTTACAA CCTCTGAATT AAGTTCGTTT GCAATTTGGA TGTTATTTAA TAAGAATTGA 9840 

15 

ATCGCAATAA ACCTAGCTTG ATACTTATCA TGAGATGTCT CTGTCATTAT TATTTGACAC 9900 

ATATTTTTAA TTGTCTCTTC AATCTTCTCA CCATAATTGA TTTTAAAATG CGGTTGATAC 9960 

20 CCTTCCCCTA GATGCTTTAT TTCGCCAAGT AAATATTTTG TTCCTTTGCC TGTACGTGCC 10020 

ACAACTGGAA AAATAGGTGT TTTTAACTTT TTCATCAATT TATGATAATC GATTTTTATC 10080 

CCGCGCTTTG TAGCTACATC AATCATATTT AATCCGATGT ATATTGGTTG ATTAAGTTCT 1014 0 

25 AACAATTGTA CTGTTAATTG CATATTTCTT TTTAGTTGAC TCGCATCAAC AATGTTAATG 10200 

ATTCCTGAAA ATGAATCGTT TAATAAATAG TCTGTCACTA CAGTTTCATC TTTAGAAATC 10260 

GGCGATAAAT CATATGTACC TGGTAAATCA ATTAATTGTC CTACATTTTC TTTAAGTTTC 10320 

30 CCTACTTTTT TCTCTACCGT TACGCCACTC CAGTTGCCTA TATATTCATA CGAACCAGTT 10380 

AAAGCGTTAA ACAAAGATGT TTTACCAACA TTAGGATTTC CTAAAATACA ATAATTTTCC 10440 

ATTCGTCCGG CTCCTATTCT TCTAATGCAA TAGAACAAGC ATCGCAATGT CTAATACTTA 10500 

35 

ACTGTTGTCC GTTTACTTCA ATAATACATG GCCCTTTAAA TAAACATTTT TGTTTAATCG 10560 

TTATGATAGC GTCATCTGTT AACCCAAAGG CACTTAGACG ATACAACATA TTCTCATTAG 10620 

CAATATCCAT TCGCTTTATT TTATAAGCCT TATTCATTTC ACCATTTTTA ATGTTTAACA 10680 

40 

TACTATTTCG CTCTCCTATT AGAAATAATA ATCATTATCA CTTAAAAATC ATAACCCTTA 10740 

AAATTGTAGC TCGCAATACT TTATTTAAAT AATTTTCATT TTTCATGTAA AATTTGTGAC 10800 

4S ATTGCAAAAA TGT 10B13 

(2) INFORMATION FOR SEQ ID NO: 365: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6804 base pairs 
so (B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 
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10 



15 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 365: 

TGATGGATTA GCAGACATTT TACGAGCGAA TGGTTTCAAA GTGTTTGGTC CAAATAAGCA 60 

AGCAGCTCAA ATCGAAGGCT CAAAATTATT TGCTAAAAAG ATAATGGAAA AATATAATAT 120 

TCCAACTGCT GATTATAAAG AAGTTGAGCG AAAAAAGGAT GCTTTAACAT ATATTGAAAA 180 

CTGTGAATTG CCCGTTGTTG TCAAGAAAGA TGGGTTAGCT GCTGGGAAAG GCGTTATTAT 24 0 

TGCAGATACT ATTGAAGCAG CCAGAAGTGC TATTGAGATT ATGTATGGTG ATGAAGAAGA 300 

AGGTACTGTT GTATTTGAAA CGTTTTTAGA AGGTGAAGAG TTCTCGCTAA TGACATTTGT 360 

TAATGGTGAT TTAGCAGTAC CTTTCGACTG TATTGCACAA GATCATAAAC GCGCATTTGA 420 

TCATGATGAA GGACCAAATA CTGGTGGTAT GGGGGCTTAT TGTCCmgTAC CACATATTAG 480 

TGACGATGTT TTAAmACTTA CAAATGAAAC AATTGCACAw CCCATTGCAA AGGCAATGCT 54 0 

20 TAATGAAGGT TATCAATTCT TCGGTGTATT ATACATTGGT GCTATTTTAA CTAAAGATGG 600 

TCCAAAAGTA ATAGAATTTA ATGCCCGTTT TGGTGATCCT GAAGCTCAAG TATTATTAAG 660 

TCGCATGGAA AGTGATTTAA TGCAGCATAT TATTGATTTA GATGAAGGAA AACGTACTGA 720 

25 ATTCAAATGG AAAAATGAAT CTATTGTAGG GGTCATGTTG GCATCAAAAG GATATCCTGA 780 

TGCATATGAA AAAGGGCATA AAGTAAGTGG CTTTGATTTA AATGAAAACT ATTTTGTTAG 840 

TGGATTAAAG AAGCAAGGTG ATACCTTTGT TACTTcAGGT GGTAGAGTTA TACTTGCCAT 900 

CGGAAAAGGT GACAATGTAC AAGATGCACA GCGAGACGCA TACAAAAAAG TATCACAAAT 960 

ACAAAGTGAC CATTTATTCT ATCGTCATGA CATTGCGAAT AAAGCACTAC AACTTAAATA 1020 

AGTAAATTTA AAATACTAAG aTTAGCTATG AACGAATCTA TAACGATAGA TTTTTTCATA 1080 

GCTTTTTTAG TTGTAGAGTC TAGGACATTG ATTTCTGTAC CAAATTTGTG ATTATGCATA 1140 

TGTAATACAA AAGAGGCGCC ACAACATGTT TGGATGAACA AAATAACATG TTTGTGGCAC 1200 

CTCTTTTGTT TAGTATGGAA TAAATGGTTT TCTTTTTCTA TACAATGAAT TTCTAATTTA 1260 

GTATCTATAC AATTATGGAT AAAATTTAAC CTACACGACC AAGACGAACA TCATCTATGC 1320 

CCGTGATGGG TAAGGTGATT GAACAATAAT ATGCCATAGT AATAATGGCA ATTAAAACTA 1380 

45 TAATAAAGAT TATATCTTTA TATGAGAAAG GTACGTTGTA ATAGTAAGTA CGAGGACCAT 1440 

CTCTAAATCC TTTCGACTCC ATCGCAACTG ATAATTGATG TGCCTTTCTA ATATTTTGGC 1500 

TTAATAGAGG TATAATTAAA TGCTTAAATC GCTTTAACCC TCTATAATTT GCCGCGTCTA 1560 

50 TCATCTGATA GCGCATTTTT AAAGATCTGC GAAgcTGTAt TAAAGAACTA ATCATTAAAG 1620 

GTATCATACG AATGGCAGCC ATGAATGCAT AAGCAACTTT TGATTTAACC TTTAAATGTT 1680 



30 



35 



40 
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ATGAAATAGC AATGGTTCTT AATGATACAT 
TATGGATAAA TCCGAATTTC AAAATTGTAT 
5 GGGAAGAGAG TAATGCAAAG CCAATACTTA 

GAGTACCATT AAACATCAAT AAGAAAACTA 
CGAAATTATG CACAAATATA ATAAAGAAAA 

10 

TAATGTTGAC ATCATCAACA AATGATTGCC 
CCATCACAAT CTAGTAACGC ACCATCTGAA 
ATTATTTCAT CGTCATGTGT AaCCATGACA 

15 

AAAAGTTTGA TCAACTGGAA TGTATTATGG 
AAGATAATAT CAGCTTTAGA ACTTAGTGCG 

20 ATAGACAACT CATAAGGATG TTGATCTTTT 
TGTATCGTTT CATCATCACT TTGATCTTTA 
TCATAAACCG AATTTGTTAT AAATTGTAAT 

25 TTTGCTGCAT GTTTAATTTT TGTTAAACGC 
TTAATCAATT GCATAATTGA TTCAAGCAAG 
ATTGTAATCC ACTCACCTAG ACCAATTTCT 
CCGCGAATAA TACGTCCATT TTTAAATTGT 
ACACGACTTG GTGCGAATTC CCATGCACGT 
TGAACATACT TCTGTAATAT GATTTCAGGA 

35 

TCCATCAAAA TGACGCGGTC GACATGATTC 
ACAACCGTTT GATCTTCCCA AAGTTCAATT 
ACATCTAACA TTGCTGTCGG TTCATCTAAA 

40 

TCAACAATTG CCAATTTCTG TTTCATCCCG 
GTAACATTTA AATTGACCAT ATTTAAAGCA 

45 GGTAATTGTC TATTTTCTAA AACGAATGCA 
TGGCTATCAG GGTCTTGGAA AATAACGCCA 
TTCATAGGTA ATTCAATTAA ATTAGGAACA 

SO TTACCGCAAC CAGAAGGACC GAGTAAAAGT 
AAATGATCGA AAATTTTACG TTGACCACTT 
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GTAAACCACG AACTAAACTT TCTGTTGTAA 1800 

GGCTACCATT CCCGTATAAA ATCATGAACA 1860 

TAGTTATAAA AATTGCTGTA ATTTTAAACT 1920 

ACATTAAGAT AGTGATATAA AGCATAAAAT 1980 

ATAGTATAAT TCCAAGAAAT AGTTTCGTTA 2040 

GAACTTTCCA TTGCTCATAC ATTCGTATCA 2100 

ATTTTAAGTC TTCTTGATGG ATAACGTTCA 2160 

ATACTTTGTC CCAAATTAAT TCGCTTTTGG 2220 

CTATCAAGTC CAAATGTCGG TTCATCTAAA 2280 

GTAgcTACGC TAAGGCGTCG TTTTTGACCA 2340 

ACATTTTGTA AATCTAAAAG TTTTAAAAGT 2400 

GAAAGGTGAT TAAAATGAAT GTTAATTTCA 2460 

TCTGGGTTTT GATAAACTAG GTACATGTGT 2520 

TGATTTTCAA AATAAACATC ACCTTGATAT 2580 

GTTGTTTTAC CACTACCATT TGCCCCTGTA 2640 

AAATCTGAGA ATGAGAGCAA TGTTGATTTA 2700 

AATAAGTGTG AGTTTGTTGT TGGAAAGTCA 2760 

GGATGCCACA CACCATATTC ACTGAGTAAA 2820 

CATTCATCGG CAATGATATT TCCGTTATAA 2 8 BO 

CAGATGTGTT TAACTTTATG TTCAACGATT 2940 

AGTTTAGTCC ATAAATCTTC TGTTGCTTGA 3000 

AACAATGTTT TTGATTGTTG AAGAATGGTT 3060 

CCACTTAAAT CTTTGATATA CGTTTCAGGG 3120 

TTGATAATTA ACGCATCCAT GTCTTCACGT 3180 

AGTTCTTCGT ATACTTTTGG CATACAAAAC 3240 

CTTAATGGGT CAACGATTAG TTCATCATAT 33 00 

ATACCACTTA ATACATTCAG AAGTGTACTT 3360 

ACTTTTTCTT TGTCTTGAAT AGTGATATTT 3420 

GGATATTTTA ATCGTAAATC ACTTACTTTT 3480 
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ATTTTGTTAC GCCTGTCTTA TCTAAAGCTT TTACTAAAAG GTAAGATAGG ACGCCGGCGA 3600 

CTACTGCACC ACTAATTAAT CTAAATACGA TGAATAATGT TAAGTTCCAA CCTGCAACTT 3660 
CATTTAAATA ACCATAGAAA TAATCTATCG GGAAAGCCGC GATTGCTGTA CAAAAACCTG - 3720 

CTAACATAGC TACCATAACT GAACGTGATT GATATTTAAA AATTGCAAAG ACAAGTTCAC 3780 

ACGCTAAACC TTGTATAAAA GCGTAAAOGA TTGTCGGAAT ATCGAAACGA CCCATAATGA 3840 

TAGTTTCGCC GGCACCTGCA GCAAATTCAG CCAGTAAAGC AATACCTGGT TTTGGAATAA 3900 

TTAGATAGCA GACAATCGCT GCCATGAACC AAACCCCGTT TGTTAATTGT TCGAGGTGAA 3960 

GGCCTGTAGC TTGCACACCA TTGTAAACAA ACCACCATAA ATTGTAAATA ACTGCGAATA 4020 

CTACTGAAAT AAGTACGGTT ACTAGTATTT CAGATAGCTT TAAACCTTTT GACATTTTTA 4 080 

CATCCTCCTA ATAAAAAAAC GCACAACCAT CCATAGGAAA GTTATGCGTT CACAATATAT 4140 

20 ATTAGTAAAA CATATGTATA GTAACACTTT CCTACGCTAG TTCAAGCTAG ATCAGGTTCA 4200 

AAGGGTTTGA GGGCAAGCCT CATCTCAGTA TAAAACACCC CTAGTGTGTG CGATTTATTT 4260 

AATTAATTAT ACTGTAAGAC GTTTGTAAAC TTATGTCAAT AGGTTGTCTT CATGAAATTT 4320 

25 CGTTTAATTC GATTTAAAAT TTATAATATT AGCATTGGAT TTAAATTGAA GATGTAGTAG 4 3 80 

GAATGTTAGT AATTAAAGAT ATAAAAATAT GTGACATGTA ATAATATTGA GCTGATAAAT 4440 

GAAGAGGGAT ACTTATCAAT CATACCTCTT TAACAACAGT GAAGAACCCG TGCATAATGG 4500 

CTTACGAATT ATAGTTTATA AGGAAGAAGA GGGATACATG CGCCGAGCAC ATGCATAAAA 456 0 

GCCCCTAACA ACTAAAAGTT- GTAAGGAAGG AGAGGGATAC ATGCGCCGAG CACATGCATA 4620 

AAATCCCCTA ACAACTAAAA GTTGTAAGGG GATTTAAATT AATTTAGTGT ATCTTGGATA 4680 

TCTTGTTTTG kTTGaTTAAT ATCTTCTGTT TTTTCTTCTT TTTTATCTTT TAATTTTTCT 4740 

TCAACTTCTT TAGCTTTTTC TGCTGCTTTT TTATTTTGAT TTTCATTAGA CATGATTAAT 4800 

TCCTCCCAAA TTGGATAATT ATTTATATAT AAATCTTACC CGGTTGTACT TTCGTTAAAC 4 860 

TTTTCTAAGT CTATAGCACT ATTTATTCAT TTATCTAAAG ACAACAACAT TAGATTAATA 4 920 

TATAATGATT TTGAGGTGAA CATAATGTCT TTTCTTAGGA AACACGCCGA AATTATTTTT 4980 

45 AGCTATTTAA TCGGTmwCGT TcACTCTTCA CTGGkcTCAT TATTTTAATT AACTTGCCAT 5040 

TAATTAAACA ATTAAATGGT GGTAAAAAAG TTGATACACA TGTTCATAAT GTGTGGGAAT 5100 

TTCTGAATGC ATTTTTCAGT GAAATTATTA AAGTAATGAG TCGATTTATA GGTAATTTCC 5160 

50 CtATAGTTAG TGCAATTGTG ATAATTATAT TCGGTATTTT AGTTATGTTG ATTGGTCATA 5220 

CATTACTTAG AACTATTAAG TATGACTATG ATATTTCTAT CTTTTTCTTA GTTATCGGTA 5280 
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TTTTCATTAT TCCATTTACA ATTCATATAG GATATATCGT CTATAAAGAT GAATTGAATC 5400 

AGGAAAATGT AAAAAATCAT TTCATGTGGA TAATTGTGAG TTATGGTATA AGTTACTTAA 5460 

5 TTACACAAAT TGCATTGTAT GGCAGAATTG ATGCTAATGA AATAGAGTCA ATTGATATCT 5520 

TAAGTGTCAA TGCTTTCTTT ATAATTATGT GGTTACTTGG TCAAATGGCT ATTTGGAATT 5580 

TCTTGTTCTT GCGCCGAGCT TTACCTTTAA CAAAGCAAGA ATTAGGTGAA GAGGAGCCAG 5640 

10 

AATTATCAAG AACAAGTAAA GGGAATGTCA CGAATCAAAC TAAAATTCAC TTGAAACAAC 5700 

TCCAAGATAA GACTACAGAA TATGCACGTA AGACAAGAAG AAGTGTCGAT TTAGATAAAA 5760 

TTAGAGCTAA AAGAGATAAA TTCAAAAAGA AAGTTAATGA TATTATCGAT ATTCAAGAAG 5820 

15 

ACGATATTCC TGATTGGATG AGAAAACCGA AATGGGTTAA ACCAATGTAT GTCGAACTAT 5880 

TTTGTGGTGT CGTCATCTTT TTATTCACAT TTTTAGAATT TAATAATCGT AATGCATTAT 594 0 

20 TTGTATCTGG TGATTGGAAA TTATCACAGA CACAATATGT TATTGAATGG GTTACATTAT 6000 

TAATTCTGTT ATTCATTATT ATCGCATATA TCGCTACAAC GTTAACTTTC CACTTGAAAG 6060 

GTAAGTTTTA TTATTTACAA TTATTTATGG GGAGCATTTT ATTCTTTAAA TTGTTAACGG 6120 

25 AATTTATAAA TATAATGATT CATGGACTAT TACTTTCAGT GTTCATTACG CCAACATTAC 6180 

TATTAATGTT ATTGGCAATC ATCATTTCTT ATTCGTTACA ATTACGAGAG CGACCATAAT 6240 

TAAAAGCATT ATAAAAGTAC TATCTATTAA ACATTTTGAT GTGTACGCTA TAAGTTAGAT 6300 

in 

ATATCTCTAA CTTACTTAGA TACAGGTCAA TGAAGTTTAT GGATAGTACT TTTTTTGTAA 6360 

CTAGATTTGA TTGATTCAGG TGATGTGAAT TAAGTATTGA rAATTGTATA CAAAGTTTTA 6420 

GTGCAAATAA AATAGTTGAA AAGTTATCCA TTTGTAAAAT CAAGAAAACT AGTAAATAGT 6480 

35 

TGAAGCGACT TATGGaATTT GCGAAACGAT ATATAGTATT TCCTTTGTAG AAATTTmACA 6540 

TATATCATTC AAATTACTAA TTTGTTAAAA TCAACAGTAA GATTAGAAGT AGATGATATT 6600 

GAAATTTGGC AAACAaTtTA ATCTATATAA AACTACAACG AAACACAGAA AGGAAGTTGT 6660 

40 

CAGATGAAAA TAGCAACTCT GAACAAAGGC AAAGAAACAA AATATTTTAA TGGATATCCT 6720 

TTAATTGAAG AAGAGGATAT CTATTCACAA GATCATTTAA AAGAAGGAGA TATTTTTCAA 6780 

4S ATTGTGACTG ATAAATCACA ATAT 6804 

(2) INFORMATION FOR SEQ ID NO: 366: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 1717 base pairs 
so (b) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 366: 





aaaAGAGACG 


CATTaAAACA 


AGCTATACAA 


ATTATCGATA 


AATTAACATG 


GGGTGTTTAG 


60 


£ 


TGGTGGTTAA AGAAATTTTG 


AGACTATTAT 


TCTTACTApC 


GATGTATGAG 


CTAGGTAAGT 


120 




ATGTAACTGA 


GCAAGTATAT 


ATTATGATGA 


CGGCTAATGA 


TGATGTAGAG 


GCGCCAAGTG 


180 


10 


ACTTTGAAAA AATCAGAGCT 


GAAGTTTCAT 


GGTAATAGCT 


ATTATCATTT 


TTGAATTAAT 


240 


TATATTAATG 


TGTGTAGCAA 


TAGCACTGGA 


GGTGTTGTAA 


ATATGTGGAT 


TGTCATTTCA 


300 




ATTGTTTTAT 


CTATATnTTT 


ATTGATCTTG 


TTAAGTAGCA 


TTTCTCATAA 


GATGAAAACC 


360 


15 


ATAGAAGCAT 


TGGAGTATAT 


GAATGCTTAT 


CTTTTCAAGC 


AGTTAGTAAA 


AAATAATGGT 


420 




GTTGAAGGTT 


TAGAAGATTA 


TGAAAATGAA 


GTTGAACGAA 


TTAGAAAAAG 


ATTCAAAAGC 


480 




TAAAGAGAGG 


CGTTGGCTTC 


TCTGCTCTAT 


CyAAAATAAT GAAAGGAGCC 


saACATGTTA 


540 


20 


GaCmAAGtCA 


CTCAAATAGA 


AACAATTAAA 


TATGATCGTG 


ATGTCTCATA 


TTCTTATGCT 


600 




GCTAGTCGTT 


TATCTACACA 


TTGGACTAAT 


CACAATATGG 


CTTGGTCTGA 


CTTTATGCAG 


660 




AAGCTAGCAC 


AAACAGTTAG 


AACTAAAGAA 


GATTTAACTG 


AGTACAATAA 


AATGTCTAAG 


720 


25 


TCTGAACAAG 


CCGATATAAA 


AGATGTTGGC 


GGATTTGTCG 


GTGGATATTT 


AAAAGAAGGC 


7B0 




AAACGGCGTG 


CTGGTCAAGT 


CATGAATCGT 


TCAATGCTAA 


CACTTGATAT 


CGATTATGCA 


840 




GCCCAAGATA 


TGACTGACAT 


ATTATCTATG 


TTTTATGATT 


TTGCATATTG 


TTTATATTCA 


900 


30 


ACACATAAGC 


ATAGAGAGAT 


AAGTCCAAGA 


CTGCGTTTAG 


TGATTCCTTT 


AAAACGAAAT 


960 




GTAAATGCAG 


ATGAGTATGA 


AGCTATTGGG 


CGTAAAGTCG 


CAGATATCGT 


TGGCATGGAT 


1020 


35 


TACTTCGATG ATACAACTTA 


TCAACCACAT 


AGGTTAATGT 


ATTGGCCTTC 


AACTAGTAAC 


1080 


GATGCGGAAT 


TTTTCTTTAC 


CTATGAAGAT 


TTACCTTTGT 


TAGACCCAGA 


TAAAATATTA 


1140 




AATGAATATG 


TTGATTGGAC 


TGACACATTA 


GAATGGCCAA 


CGTCTTCAAG 


GGAAGAGAGT 


1200 


40 


AAGACTAAAA 


GATTAGCAGA 


TAAGCAAGGC 


GACCCAGAAG 


AAAAGCCGGG 


AATTGTTGGT 


1260 




GCATTTTGTA 


GAGCCTATAC 


GATAGAAGAA 


GCTATAGAAA 


CTTTTATTCC 


TGATTTATAC 


1320 




GAAAAACATT 


CTACTAACCG 


TTATACCTAT 


CATGAAGGTT 


CAACTGCAGG 


TGGATTGGTG 


1380 


45 


TTATACGAAA 


ATAACAAGTT 


TGCCTATTCT 


CATCATAATA 


CGGATCCCGT 


AAGCGGTATG 


1440 




CTTGTGAACA 


GTTTTGATTT 


AGTACGCATA 


CACTTATATG 


GTGCTCAAGA 


TGAAGAAACT 


1500 




AAAACAGATA 


CTCCGGTTAA 


TCGACTACCT 


AGTTATAAAG 


CAATGCAGCa 


AAGAGCGCAA 


1560 


SO 


AATGATGAGG 


TTGTTAAAAA 


GCAATTAATT 


AATGACAAAA 


TGTCTGATGC 


AATGCAGGaT 


1620 




TTCGATGAAn 


GAGAAAATAG 


CGATGATGCA 


TGGTCTGAGA 


CGTTnGAAAT 


TACTTCGAAA 


1680 
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(2) INFORMATION FOR SEQ ID NO: 367: 

(ij SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1847 base pairs 
<B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY : linear 



10 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 367: 





AAGATTAGGC 


ATCAAGACAG 


GGTCGCGATT 


GTTTGAAATC 


CCACATAGnA ATGATATTTa 


60 


15 


CaTTATCAAT 


CCaAGTATGC 


GTAAATATCT 


TAATGTTTCA 


GTTGCTATTT 


CTAAGATTGC 


120 




ATTGCGTTAT 


ATTCCACCTG 


AAGATTTACA 


CCAATATAGT 


ATTGACGAAT 


TTTTTATGGA 


180 




TGTTACTGAT 


AGCTATCATA 


GATTTAGTTC 


TACAGTACAT 


GCATTTTGCG 


AAAGACTTAA 


240 


20 


ACGTGAAATT 


TATGAAGAAA 


CAGGCATTTA 


TTGTACTGTG 


GGCATTGGTT 


CTAATATGTT 


300 




ATTAAGTAAA 


ATTGCTATGG 


ATGTTGAAGC 


GAacATAGTc 


AAAATGGTAT 


AGCTGAATGG 


360 




CGATATCaAG 


ATGTACCAAC 


GAAATTATGG 


CCAATTCmGC 


CCtTGCGAGA 


TTTTTGGGGT 


420 


25 


ATTAATCGTC 


GAACAGAAGC 


CAAATTGAAT 


AAAAGAGGAA 


TTTTTACTAT 


AGGAGATTTA 


480 




GCGAAATATC 


CATATAAATT 


TTTAAAAAAA 


GAGTTCGGTA 


TTTTAGGTGT 


TGATATGCAT 


54 0 




CTACATGCGA 


ATGGGATAGA 


TCAGAGTAAA 


GTACGTGAAA 




CAGCAATCCA 


600 


30 


TCGATATGCA 


AAAGTCAAAT 


ATTAATGAGA 


GATTATCATT 


1 luiilbAAuL 


SRJV A Z*" 1 T 1 7\ firry*. 

AAAAGTAGTA 


660 




ATGCAAGAGT 


TAATTGAAGA 


TGTTGCTAGC 


AGAGTTCGAG 


CAAGAAAAAA 


AGTGGCAAGA 


720 


35 


ACGATACATT 


TTGCCTTTGG 


CTATAGTGAT 


GAAGGCGGTG 


TACATAAGCA 


ATATACTTTG 


780 


AAAGATCCAA 


CAAACTTAGA 


AAAAGATATT 


TATAAAGTAG 


TAATGCATTT 


CGCAGATAAA 


840 




TTATGTAATA 


AACAAGCACT 


ATATCGTACG 


CTAAGTATAT 


CTTTGAGTCA 


ATTTATTAAT 


900 


40 


GAGGATGAGC 


GACgTTAAGT 


CTGTTTGAAG 


ATGAATACCA 


ACGCAAACGT 


GACGAATGTC 


960 




TAGCTAAAAC 


GATAGACCAA 


TTACATTTGA 


AATACGGCAA 


AGGTATTGTG 


TCCAAAGCAG 


1020 




TATCGTTTAC 


AGAAGCAGGT 


ACAAAACACG 


GCAGATTAGG 


TTTAATGGCT 


GGACATAAAA 


1080 


45 


TGTAATGACT 


ATACGGTTTA 


AGTAATATAT 


AACTGTGATT 


CGTATAAAAT 


AAGTCTCTAA 


1140 




AGATAAATAT 


TTCATATATC 


ACAATAGATT 


TTCACAATAA 


TATCTAAGAA 


TACATGGAAT 


1200 




TTATCAAAAG 


AGACTTAATA 


ATTATTGGAT 


ATAACAATCA 


AAATCACTCA 


ATGCTTGCAT 


1260 


50 


ACCGCGTTCT 


CGGTCAGTAG 


GGTTTTTGAA 


ACTAATTTTT 


AAAGCACCGT 


ATATATCTTC 


1320 




GCGTACTTCT 


AAGATTCTTA 


AGTTGCTTAT 


AGATATGTTA 


TGTAAACTCA 


GGATATAAGT 


1380 
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TAGTCCACCT AGTTGTTTAG CGGGTAGTGC GTCGCGATAC GATTTAGCTT GGGCAAAAAA 
TGATAACAAT TTTTCAGAAT CATTGCTTTC AATTAGTCTt TCTAAATCTT GAAACTGACT 
TTTTAGCTGT CGAATCATTT CTAAAATATA CGTTTTATTA CTCAAGGTGA TATCTTTCCA 
CATTTGTGCA TTACTACTAG CTATACGAGT GATATCACGA AAACCACCAG CTGCAAGTTT 
ATTAACTAAA TGATGTTCTT GACCGTTCTT TTGACTAACA TGAACTAAAC TAGATGCAAC 
GATATGAGGT AAATGACTTA CGACGCTTGT TACGTAGTCG TGTTCTTCAG CAGTAGTTAC 
AATAAATTTA GCAAGAGTAG GTGATAACAG TTCTTTTAAC GTGTTTG 
(2) INFORMATION FOR SEQ ID NO: 368: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4 94 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 368: 
AACAAAAGGC ATAAGTTCGT GAATTAATGC GTATACAAGG ATAAAGCTTA TAACAGTAGT 
AATTGTTGCT ATCAAACGAA CAACATATAT TCTATTTTCA GATAGCAATC GATTCACTAA 
TCGATAATTT ACGTATACAA GAATTAACAA CAGCACAATA TAAACAATAA TCATATTTGG 
CCCCATTTAA TTTTTAAATT TGTTTTCACA TCATTTTCTA CTTTATTATC ATACTAATTT 
TAAAGGCAAA GGTGGACATC GGCAACCTCT CGTAAACTAT TTATCAAAAA TAAACGTATC 
TCATTGTTAT GATATTTATA AATCAATTCG TTTTTATTAA AGTCTTTTTC AACAAGTTTG 
TCACTATCTA TTAAATAATC ACGCATGCAT CCTTTTAAGA AATCATCTTT ATAACTTGGT 
GTGTACCATT TTCCATCCTC TTCAATGACA ATGTTGCCAA TATCAAATTC AAGGACCTTG 
CCGTCCTCTG AAGT 

(2) INFORMATION FOR SEQ ID NO: 369: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2518 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 369: 
GTCCATATTT CCCGTCCAAC CAACTAAAAA TGGGTAAATC CCTGGATTTa AATCTACTTC 
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GATAATTTCn AATGTAGCGA CCATCATTAC 
GTTGACCAAT ACTATCGCCT TCTTCTTCGA 
5 CAATTTCTAA TGAAGATTTA ATTCGGTTAT 

CAATAGCGAC ATCTGTACCA TGTCCTTGGT 
TTTCAATATT TTTAGGAATA TCTCCCAATA 

10 

CACCAGCCGT ATGAGAACTT GAAGGGCCCA 
TTTGATAATC ATAGCTCTTT GCCATAATTA 
CGGCATTTTA AAGTTGATAT TCATTAAATT 

15 

GGCTAAGACA ATGCTGACAA TAATCACTGT 
ATTAAAGCCA AACAATACGA TGGCGCCTGC 

20 [ TACTAGTCCG CTAAATGTCA CGATACATGC 
ATATAGTTGT ACTGGATATT GCGCTATTAA 
TGCAAATGCT TTTGACGGTC CACCAATGTT 

25 TGAGCTACCT GTACATGTTA GTGCTCCAAT 

ACTTGTTAAT ACCATTGAAC TTAGCGGTGT 
AATGACCGCT AATGCATATG GATTGTTATC 
TTTTAATGTT GCTAGCACAC CAGGTGTAAT 
TGCAAATAAG ATCACCACAA TTAAGTCCAA 
AATTAAAAAA GcTACGCCAT AAGCTGCGAT 

35 

TACTAAACCA ACAATGACCG CAAATACTGG 
ACCTACTGcG ATACCGCTTA AACTTCCTGC 
ATCAAATACG CCACCAATAG CATAACTTAA 

40 

TGCACCGGAT AATGCTTGTA GTCCTTGTTT 
CATGATCACT AAAACCAAGA CTAATGTGCC 

45 ACCTCTCTCT ATGTTTATTT TATTTTCAGA 

TTTTCAACTT TTATCTGTTA TCAAATCaAA 
AGATTTTTAA AATGGATTGT TTCAAAAACT 

SO ACTTTTTACT CTATATTTCA AACAGTTGTG 

GAAAGTAAGT AATATTTCTA AAAACTTTTA 



GAGATGATTT GATATAAGCA CAGTTTGGAT 180 

TGATATCTAT TTTAATACCA TCATCAGCTG 240 

CAAATGTTGA ATATCCCATT GCTCCACCCA 300 

GTGTTTGAGC AAATGATTCA TAATAATGTA 360 

TTGCGCGTGC TGAATTCCCA ATCTTTACTG 420 

TCATAACTGG TCCGATAATA TCGAAAGCAC 480 

AACACTCTCC TTAATATGAT TCTTTTTGCT 54 0 

AAACTTATTA ATTAGTGTTC CAATAATATA 600 

TGCGATTGTT ACAATTGATG TCACTGCATT 660 

AATTGGTGTT GCCATACCTT TGACACCTAT 720 

GTTGACGACC CCAATCAGTG CATTTGTACC 780 

ATCAATTTGC GTCAATGGCT CAATACAAAC 84 0 

TAATTTTCGG AATAAAATAA GGTTAACAAA 900 

AGCCATAGGA ACACCTGTCA GTCCTAATAA 960 

CATACCTGTA ACAGGAATCA CTAGTCCTAA 1020 

ACCTACCGCA GTGACAGCAC TACCTATTTG 1080 

GATTGATGCA AGTCCGAAAG CAATTGCTGG 114 0 

GCCTTCTGGA ACTTTCTTTT CAATCCATTT 1200 

GAATGCTGGT AATAATTTAA AGTCATGTAA 1260 

TGCAACGCCT AAGTTTAAGC ACGTTAGAAT 1320 

TAAATCCCCA ATATCTTGTA GAAATTTAAT 1380 

GAATGCTTGT GGTAGAAATG TCGCACAAGC 1440 

ACCGTACGGT GCATACTTTA AAAATAGCGT 1500 

TACACCTAAC AGAATATCCA TTTCCCAAAA 1560 

CCATAAACAT CGTACACCCT TAAGAAAACG 1620 

TATTTAAGTG AAATATTTCA TATTTGTGAA 1680 

ACTTATGTTG TCGTTAATAT TTACTAATTA 174 0 

TGACAGTTTT TTGATAACTT TTTTACATCT 1800 

ATATTTATAC ACTTTATCTT TCGAGCTATT 1860 
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5 



10 



15 



ACACATATAT 


TTGCAATAAG 


ATAATTAAAG 


TAGGATATTA 


TTTTTAGTTT 


TCTGATAGGA 


1980 


ATGATGATAG 


TCTATAGGTT 


GAATCTTTAC 


T1T1TTTTAA 


AGCTAAATTT 


ACATCAACTT 


2040 


AACAATGGTT GGTTATACTG 


AAGATGAAAA 


TATTTAGTAT 


AACTTAGTGG 


AGGCGATAAA 


2100 


GGTGCAATTG 


AGTCATTCCG 


TTAAAGTTGC 


AATTTCTATC 


TATTTAGCAC 


TTATCTTTAT 


2160 


AACGTTCACT 


TCTTATTTAG 


TCATTATTTT 


ATATACGAGT 


ATGACTGGAC 


ATGATGTATC 


2220 


ACATTTCGTG 


TTAGATAGTC 


AGCATTCTCA 


TCATGGATCT 


CTTACGCAAA 


AACATTTGAG 


2280 


TCTTCCTGAA 


ATCTCATTTA 


AATAGTTTAT 


CCTCTGTGTT 


TCAACATTCA 


TTTCCCATAT 


2340 


CGATTCATTT 


ATCTATCATC 


TAGACCACTA 


CATCTTAGAT 


GATTTTTITA 


TTTTCTCATT 


2400 


TCACTCTTTC 


TTAAAAGTCG 


ATATAATGAA 


TTAAATCATT 


ATCATACACC 


GACATATTTT 


2460 


ATGTTGTTGG 


TGTTAAGTTT 


aAAGGGGTGA 


GATACTTGGC 


GAATaATCaT 


TCAGCTTT 


2518 



2Q (2) INFORMATION FOR SEQ ID NO: 370: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 790 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
25 (D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 370: 

30 ATACTACTGG ACCGTCnACC AATTGACAAA ACCTGAAAAC TGGATTTTTA TTGCAGGATT 60 

ACATCGAACC TGGAAGAACA ATCCCCAGGA GTTGATGATA TTCGAGATAT GGCATACAAT 120 

CAAGGTAGTT TAGATAAGAC AATTTATGAA ATTTCTAAAC GCACAGTACT ATTTTTAATA 180 

35 

CAGAAAGATA TTACGGTATA TAATAAGACG ATTGACTGTT TAAATTATTA TAACTATAGT 240 

GACGAAAGAA TAAAGGATGA TTAAATGAAT TCACAAGAAT TATTAGCAAT TGCTGTGGAT 300 

GCAATTGACA ATACCCCAGG CGAAGATACG ATTTCTTTAG AAATGAAAGG TATCAGCGAT 360 

40 

ATGACAGATT ATTTTGTTGT AACGCACGGA AATAATGAAC GACAAGTTCA AGCGATTGCT 42 0 

AGAGCGGTGA AAGAAGTAGC CAATGAACAA AATATAGAAG TAAAACGTAT GGAAGGATAC 480 

45 AATGAAGCGC GTTGGATATT AATTGACTTA GCTGATGTTG TGGTACATGT TTTCCATAAA 540 

GACGAAAGAA ATTATTATAA TATTGAAAAG TTATATCAAG ATGCACCATT AGAATCATAT 600 

AGTCAGGTTG CGTATTAATT ATGTCGCAAT ATGCAGAAAT GAGCCTAGTG TACGATCAAT 660 

50 TGACTCAAGA TCAACCATAT GAAAAATGGT TTGAAATTGT AAAAAATCAC TGCAAAGATG 720 

AATCAAATAT TTTAGATATT GGATGCGGTA CTGGTAGTTa ACAGTTCAAT TAGAAGCTTT 780 
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(2) INFORMATION FOR SEQ ID NO: 371: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1823 base pairs 

(B) TYPE: nucleic acid 

<C) STRAND EDNESS : double 
(D) TOPOLOGY: linear 

10 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 371: 
ATAGATGAAG GTGCAAATAT TGAAaTAGGT TATTTACCTG GACGCTTGAA ATGGTTAGTT 60 

15 GCTGATTTAT TAACTAAACA AGGATTAAAA GTAGTTAACG ACGATATGAC AGGAAGAACG 120 

TTAAAAGATC GTAAATTATT AACAGGTGAC AGTCCTTTAG CTTCAAATGA GTTAGGAAAA 180 

TTAGCAGTTA ATGAAATGTT AAATGCAATA CAAAATAAAT AATTAAATAT TAATTAGAGG 24 0 

20 AGCCTCATAT GTAAATGTAT GAGGGCTCTT TTTTTTGGCA AAATTTAAGT GATACTTGTA 300 

AAATAGAACC TATTATGAGT ATGATTTAAG AAAACGCTTG CAAAACTAAT AACCGCAACT 360 

AGCGATATGG AGGAAACATG ATGTCTTATA GCATTGGAAT TGATTATGGA ACTGCTTCAG 420 

25 GCCGTGTGTT TTTAATTAAT ACAACTAACG GTCAAGTAGT ATCAAAATTT GTGAAACCAT 4 80 

ATACACATGG TGTCATTGAG AGTGAATTAA ATGGTTTGAA AATACCACAT ACATATGCAC 54 0 

TTCAAAATAG TAATGATTAT tTAGAAATTA TGGAAGAAGG AATATCATAT ATAGTACGTG 600 

30 

AATCAAAAAT AGATCCAGAC AATATAGTAG GTATTGGTAT AGACTTTACT TCAT CTACTA 660 

TTATTTTTAC TGACGAAAAC CTTAACCCGG TACATAACTT AAAACAATTT AAAAACAATC 720 

CACATGCGTA TGTGAAACTT TGG AAA CATC ATGGTGCATA TAAAGAGGCA GAGAAATTAT 780 

35 

ATCAAACTGC TATTGAAAAT AATAATAAGT GGTTAGGCCA TTATGGATAT AATGTTAGTA 840 

GTGAATGGAT GATTCCCAAA ATAATGGAGG TCATGAATCG AGCACCAGAA ATTATGGAAA 900 

AAACGGCTTA TATTATGGAA GCGGGCGATT GGATTGTAAA TAAATTAACT AATAAAAATG 960 

40 

TACGCTCGAA TTGTGGATTA GGTTTCAAAG CATTTTGGGA AGAAGAAACA GGGTTTCATT 1020 

ATGATTTATT TGATAAAATA GACCCCAAAT TATCAAAAGT AATTCAAGAT AAAGTATCTG 1080 

45 CACCGGTTGT TAATATTGGT GAAGCAGTAG GGAAACTGGA TGATAAAATG GCACAGAAAT 1140 

TAGGATTATC AAAAGAAACT ATGGTAAGTC CTTTTATTAT TGATGCCCAT GCTAGTTTAT 1200 

TAGGTATTGG GTCTGAAAAA GATAAAGAAA TGACTATGGT GATGGGAACA AGCACATGCC 1260 

50 ATCTTATGTT AAATGAAAAG CAACATCAAG TGCCAGGTAT ATCAGGTTCT GTAAAAGGAG 1320 

CAATT ATT CC AGAATTATTT GCTTATGAAG CGGGGCAATC AGCAGTAGGT GATTTGTTTG 1380 
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CTGTATTTGA 


ATTAATGAAT 


GAAAAGATAA 


AACATCAAAT 


GCCAGGTGAA 


AGTGGGCTCA 


1500 




TTGCTCTTGA 


TTGGCATAAT 


GGAAATCGAA 


GTGTATTAAG 


TGATAGCAAT 


TTAACAGGTT 


1560 


5 


GTATCTTTGG 


ATTAACTTTA 


CAAACTAAGC 


ATGAGGaTAT 


TTATAGAGCm 


TATTTaGaAG 


1620 




CTACaGCATT 


TGGTACtAAG 


ATGATTATGC 


mACAGTATCA 


AGATTGGCAT 


ATGGaAGTAG 


1680 


70 


aAAAGGtATT 


TGCaTGTGGc 


gGTAtACCtA AAAAGAATGC TGTTATGATG 


GATATCTATG 


1740 


CGAATGTACT 
CAGCAATATT 


GAATAAAAAA 
AGGTGCAGTC 


CTAATTGTTA 
AGT 


TGGATAGTGA 


GTATGCACCA 


GCAATAGGCG 


1800 
1823 


15 


(2) INFORMATION FOR SEQ ID NO: 372: 








20 


(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 1600 base pairs 
tB) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 










(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 372: 






25 


ACGATCATCT 


GCATCAGCGA 


ATTCCGATGc 


AaTTcATATG 


tCCtAATAAC 


AAAAGAATAG 


60 




GTTTTaAAAG 


ATATGCATAC 


CGTAATGaTA 


GATATAGTTT 


TAAACGTGAC 


TTCAAGCTAT 


120 




ATGaATGTGA 


TGACTGTTCA 


TCATGTTCTT 


TGAGACATCA 


ATGCATGAAG 


CCAAATTCGA 


180 




AATCCAATAA 


GAAAATTATG 


AAGAATTATA 


ATTGGGAATA 


CTTTAAAGCC 


CAAATTAATC 


240 




AAAAGCTTTC 


TGAACCAGAA 


ACGAAAAAAT 


CTATAGTCAA 


AGAAAAATTG 


ATGTAGAGCC 


300 




TGTTTTTGGA 


TTTATGAAGG 


CTATTTTGGG 


TtTCACTCGA 


ATGTCAGTTC 


GGGAATAAAT 


360 


35 


AAAGTTAAAC 


GAGAGCTAGG 


TTTTGTATTA 


ATGGCACTTA 


ATATAAGGAA AATAgcaGCT 


420 




CAACGAGCTG 


TACATTATAA 


AATACATATC 


AAAAAAGCTG 


ATTTCTATCA 


AATAAATAAT 


480 


40 


AGAAATCAGC 


TTTTTTACAT 


TGCCTAAGAA 


CTTTAAGGAA 


CTTAATGTCC 


CAAGCTCTTT 


540 


TTTGTTATAT 


CTAATTCGTA 


ATTTATGATT 


GTTTATTCGG 


TCCTTTGATG 


TTCACTAAAT 


600 




GTGACTTTAA 


ATCTTGTTCT 


AATTGTTGTA 


ATTCTTTTTC 


AGCTAATTGT 


CGTTCTTCGC 


660 


45 


GACCGTGTTG 


TTGAATAATT 


AATGTTTCTT 


CAATTGTCTC 


AATAATGTTA 


CGCTGTGTAC 


720 




GTTTCAATGT 


ATCAAGATCA 


ACAATGCCAC 


GCTCATTTTC 


TGTTGCAGTT 


TCAATCGCAT 


780 




TTTGTTTCAA 


CATTTCAGCA 


TTTGCTGTTA 


ATAAATCATT 


AGTTGTATCA 


GTGACAGCTC 


840 


SO 


GTTGTGCAGC 


AACTGCATTA 


CGCTGTCTCA 


TTAATGTAAG 


CGCAATGGCC 


ATTTGATTTT 


900 




TCCATAGTGG 


AATACTTGTC 


AAAATTGAAC 


TTTGTATCTT 


CTCGGCAAGT 


GCTTGATTAA 


960, 
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AGTCATATAT 


GCGTTTATCT 


AGTCTATCTA 


TAAATTGCTG 


CATATCTGCA 


ACTTGTTGAA 


1080 


TATCCATTTG 


ATTAGTGGAt 


TgtGCGCTTG 


CTGTTGCAAT 


TGTGGTAGCT 


TTTCATTTTC 


1140 


TAATTGCAAC 


TTTTTTTGcT 


GTGCAGCAAT 


GATATGCAAT 


GATAAGTCAT 


CAAAGTATTG 


1200 


TTTGTTTTTA 


TCATATAGCG 


TATCTAATAA 


TTCAATATCT 


CTTGTTAAAT 


GTGTTTGATG 


1260 


TTTCTGCAGT 


TGAATCGTTA 


TGCGATCGAC 


TTGAGCACTA 


ACTGATTGCA 


TTCTTGAAAA 


1320 


GATTTCATTG 


ATAGACGACT 


TTGCTCTGCT 


AAAAATTCTT 


TTTAACATAG 


ATGGTTTATC 


1380 


AGTATTTAAC 


TCATTTGGAT 


TAACTGACTT 


TAGTTrTGAC 


ATTAGATCTG 


ACAAAGTATC 


1440 


TCCAATAGGA 


CCAACATCTT 


TACTTTGTAC 


TTCATCCAAC 


ATTTGATGTG 


AAAATTGAGA 


1500 


CATTTGTTTC 


TGkAAATCAG 


AACCAAACGC 


TAATAAACCT 


TCATTGTCTA AAGGGTTAAT 


1560 


TTGTTTACTG 


ATTGTGTCTA 


CCTGTTTTTG 


TTGTTCAATT 






1600 



20 (2) INFORMATION FOR SEQ ID NO: 373: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1227 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
25 (d) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 373: 

30 .. 

ATGTTGATAA TGGTAGCTTC TACAAGAATA AAGACCAACA AGTTGGTGCA ACAATTCTTG 60 

aTAGTAAAAC TGGTGGTTTA GTTGCTATAT CTGGTGGACG TGATTTCAAA GACGTCGTTA 120 

ACAGAAACCA AGCAACAGAT CCTCACCCTA CTGGTTCATC TTTAAAACCT TTCTTAGCGT 180 

35 

ATGGACCTGC CATTGAAAAT ATGAAATGGG CAACAAACCA TGCGATTCAA GATGAATCTT 240 

CATATCAAGT TGATGGTTCT ACATTTAGAA ACTATGATAC GAAGAGTCAC GGTACTGTAT 300 

CTATTTATGA TGCTTTACGA CAAAGTTTCA ATATCCCAGC TTTAAAAGCT TGGCAATCAG 360 

40 

TTAAGCAAAA TGCTGGTAAT GATGCACCTA AGAAATTCGC TGCCAAACTT GGCTTAAACT 420 

ACGAAGGCGA TATTGGTCCA TCTGAAGTAC TTGGTGGTTC TGCTTCAGAA TTCTCACCAA 4 80 

45 CACAATTAGC ATCAGCATTT GCTGCAATCG CTAACGGTGG TACTTATAAC AACGCGCATT 540 

CAATTCAAAA AGTAGTTACT CGTGATGGTG AAACAATCGA ATACGATCAT ACTAGCCATA 600 

AAGCGATGAG TGATTACACT GCATACATGT TAGCTGAGAT GCTAAAAGGT ACATTTAAAC 660 

50 CATATGGTTC TGCATATGGC CATGGTGTAT CTGGAGTAAA TATGGGTGCT AAGACAGGTA 720 

CTGGTACTTA CGGTGCTGAA ACTTATTCAC AATATAATTT ACCTGATAAT GCAGCGAAAG 780 
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AAGTTAAACA ATATGGTGAA AACTCATTTG TrGGACATAG CCAACAAGAA TATCCACAGT 900 
TCTTATATGA AAATGTGATG TCAAAAATTT CATCTAGAGA TGGCGAAGAC TTTAAACGTC 960 
5 CTAGCTCAGT AAGTGGTAGT ATCCCATCAA TCAATGTTTC TGGTAGTCAA GATAACAACA 1020 

CTACAAATCG TAGTACACAC GGTGGTAGTG ACACATCAGC AAACAGCAGT GGTACTGCAC 1080 
AATCAAATAA CAATACTAGA TCTCAACAAT CTAGAAACAG CGGTGGATTA ACAGGTATAT 1140 

10 

TCAACTAATC CACTCAACAT AAAATCCTCA GTTATACCAT ATTTATGGTG TAGCCGAGGA 1200 
TTTTnTTAGG TTCTTCATCT TTTATGG 1227 
(2) INFORMATION FOR SEQ ID NO: 374: 

15 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1953 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
M (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 374: 



25 


CCATATGGtG 


CAACATTCTT 


CGTATTTAGT 


GATTATTTAA 


AACCAGCGTT 


ACGTTTATCA 


60 




TCAATTATGG 


GATTAAATgC 


aACGTTCATC 


TTCACACATG AyTCaATTGC AGTAGGTGAA 


120 




GATGGTCCTA 


CTCATGAACC 


AATTGAGCAA 


TTAGCTGGAT 


TAAGAGCCAT 


TCCAAATATG 


180 


30 


AATGTTATCC 


GTCCTGCTGA 


TGGTAATGAA 


ACAAGAGTAG 


CATGGGAAGT 


TGCCTTAGAA 


240 




TCTGAATCTA 


CACCTACTTC 


ATTAGTATTG 


ACACGTCAAA ACTTACCGGT 


ATTAGATGTA 


300 




CCAGAAGATG 


TAGTTGAAGA 


AGGCGTTCGA 


AAAGGTGCCT 


ATACAGTTTA 


TGGCTCTGAA 


360 


35 


GAGACACCAG 


AATTCCTATT 


ATTAGCTTCA 


GGTTCAGAAG 


TTAGTCTTGC 


AGTTGAAGCT 


420 




GCTAAAGATC 


TTGAAAAACA 


AGGTAAATCA 


GTACGTGTTG 


TTTCAATGCC 


TAACTGGAAT 


480 


40 


GCATTTGAAC 


AACAATCTGA 


AGAATATAAA 


GAATCAGTTA 


TTCCATCAAG 


CGTAACAAAA 


540 


CGTGTTGCGA 


TTGAAATGGC 


TTCACCGCTT 


GGATGGCATA 


AATATGTAGG 


TACTGCAGGT 


600 




AAAGTTATTG 


CTATTGACGG 


CTTTGGCGCA 


AGTGCACCTG 


GCGATTTAGT 


AGTTGAAAAA 


660 


45 


TATGGATTTA 


CAAAAGAAAA 


TATCTTAAAC 


CAAGTTATGA 


GCTTATAAGA ATAATTTATA 


720 




AAGCGAGTAT 


GTTTAGAAGT 


CTAGGATGCA 


TAATCTTAGG 


CTTCTTTTAA AGTGTTGAAA 


780 




.TTTAGAGTAT 


AGCACTTAAA 


CTACATCATA 


AGTGATAAGT 


TATGAAAGTA 


TACTATTTCA 


840 


50 


GATTAATCTT 


TAAAAGCTCT 


GTTATAACAG 


CATGATTTTT 


GATATTATTT 


TTAGTATCGA 


900 




TATTAAAATA 


CTTGAATAAA 


CTAGTTCTTG 


AAATAATGTG ATGAATTTAO 


TAAAATTCAG 


960 
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5 



10 



15 



20 



25 



TG CATT A ATT 


1 x AV>v? 111 AA 


TTGGAGGTTT 


CCTTTTAGCT AGAAAATATA TGATGGACTA 


1080 


CTTGAAGAAA 




T*P TV IV f^f~* TV IV S** IV 

TCAACGAAGA 


AATGCTTCGT ATGATGATGA TGCAAATGGG 


1140 


TCAAAAACCT 


TfTfana jap a 


Kit ft ft T\ f\ TV/"* TV 

AAATTAATCA 


AATGATGACG ATGATGAATA AAAATATGGA 


1200 


TCAAAATATfi 




ft TV TV IV f**Y* * Ik * 

AAAAGTAAAT 


TCGCAATTGA TAGAGGCTAT TTTCCAGATA 


1260 


TGGAAATGGC 


wlwl 1 1 1 i Al 


& a TP TV A TV *HHf* TV 

AATCAAATTA 


ATAAGAATAA ATATGTTTAT TAAAATTAAA 


1320 


GTTAAC'AAAA 


1 bALbAAJ, At? 


ACTGAGAAAT 


GCTATAATTC ATTTTGTATG ATTTACAGAG 


1380 


7ifZ'l w i"l'2L l l w T w PB 


AuGAGAAGGT 


GTCyGCGTGC 


TCTATTTAAT ATTTTCAATC ATTGTAGCTT 


1440 




TV A /~"T" 7\ r PTV IT* 

AACTATAGTT 


ATAGTTATTC 


f 

GTATGAAAGC TCAAAATTAT CCGGTAAAJcG 


1500 


fi,^7xZlZL&.£.&.7AT 
nwvvvUviAi 


AGTTTTGCCa 


CCgTTTl'rrA 


tGGCgACCGG TGCATTGATG TACGTCGTTG 


1560 


C a TATTTTAG 


GCTAACAGGA 


TCGGAAATGC 


TAGAAGCCTT TATAATTGGT TTGCTTTTTT 


1620 


L C ACACjTTCT 


AATTTGGACT 


TCTCGATTTG 


AAGTCAAAGG TACAGAAATT TATATGAAAC 


1680 


GATCTAAAGC 


ATTTCCAGTT 


ATTTTGATTT 


CATTACTTAT CATTCGTACT GTGATGAAAA 


1740 


T ATT CATT AG 


TAATGAAATA 


GATCCTGGAG 


AATTAGGCGG CATGTTCTTT TT ATT AG CAT 


1800 


TCTGTATGAT 


TGTTCCTTGG 


AGAGCAGCAA 


TGCTATATAA ATAGAAAAAA CTAAAGAAAA 


1860 


CATTAATCAA 


ttaattactt 


TTaAAACCAC 


TTGTGATCGA CTTCTAAATC AGTCAATGAG 


1920 


TGGGTTTAAT 


nTTACTTGGA 


AAAGGnGGAA 


AGG 


1953 



30 (2) INFORMATION FOR SEQ ID NO: 375: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3787 base pairs 

(B) TYPE: nucleic acid 
35 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 375: 

40 



45 



SO 



ACATTTGATC 


AAnTTATCGA 


GATTAAAGAT 


GAATTCAnTT 


GATCGTnTCA 


ATGATTATCC 


60 


TGTTGAAGTA 


GCACGTTTGC 


TTGATATAGT 


GGAmATaAAA 


GTACACGCAT 


TACATTCAGG 


120 


TATCcACGTT 


GATTAAAGAT 


AAAGGGAAAA 


TAATTGATAT 


TCATTTATCT 


GTAAAAGCCA 


180 


CTGAAAATAT 


TGATGGCGAA 


GTGCTGTTCA 


AAGCAACACA 


ACCTTTAGGT 


AGAACAATGA 


240 


AGGTTGGTGT 


TCAAAATAAT 


GCAATGrCAA 


TTACTTTAAC 


GAAACAAAAT 


CAATGGCTTG 


300 


ATAGTTTGAA GTTTTTAGTT AAGTGCATTG 


AAGAAAGTAT 


GAGAATCAGT 


GATGAAGCAT 


360 


AAAGAAGCAT 


TTAATGGCGT 


TGTCGTGTTA 


ACTGCTGCAT 


TAATTGTCAT 


TAAAATTCTG 


420 
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40 



45 



50 



CAACAAGTGT ATCCAATTGT 


AGCATTAGGA 


ATGATATTAT 


CGATGAATGC 


CATTCCTAGT 


540 


GCAATTACAC 


AAAATATAGG 


GAAGTATCAT AGTGACGAAG 


CATATGCAAA 


AGCAGTCGCT 


600 


TATATACAAT 


TAGTTGGTAT 


A TT ATT A TTT 
±m a.*\x x x 


ATTflfTATTT 


TTGTGTTTGC 


GAACAATATT 


660 


GCACATATGA TGGGTGATGG 


C PATTT AA C A 


f^f 1 A ATYlATTr* 
V-UAMluAl 1G 


AAGCTGCAAG 


TTTAAGCTTT 


720 


ATATTTATAR 


fiTATnrnyy 


CGTGTT A AG A 


GGTTATTATP 


AATCTGCAAA 


TAATATGACA 


780 


VJ A 1 Xt\ 


1 1 ll~l v v_!AGOl 


TATAfiA ACQ A 




TAGGTATTAT 


CATTGTTACT 


840 


ATTfSTT A TTT 

t\ X X\J X lAi X X 


1 IvjIAUALIAG 


AVjvjI 1 VjoAv-o 


A I A 1 A 1 \jAAG 


CGGGAACAAT 


TGCTATTTTA 


900 


fir* ATf a a r*c a 


1 AGG i, TiTiT 


AuG 11L11 GA 


ATTTATTTAG 


TAGCGCACCG 


ACCTTTTAAG 


960 


TTT A A 

1 1 lAAAAloG 


1 AAATAACAC 


1 GGAAAGATC 


GTTTGGAAAC 


AGTTCGCACT 


TTCGGTTTTG 


1020 


fi^P^P^P^P^^ ^*1*TA 


1 CAGTCAATT 


AAT CGTAATT 


TTATGGCAAG 


TGATTGATAG 


TGTTACTATT 


1080 


att A arT r* a r* 


I i CAAGCGAT 


ACGCGTGCCA 


TT CGATGTTG 


CCATAACTGA 


AAAAGGAGTC 


1140. 


T A TV! A HfHTT' 


G IGCATCA 11 


TATTCAGATG 


GGATTGATTG 


TAACTACAAC 


ATTTAGTTTT 


1200 




CTCTGTTAAG 


rGACGCAAT C 


AAAATGAATA 


ATCAGGTACT 


TATGAATCGT 


1260 




LG 1 GA 1 1 AAA 


GA 1 1 AGGATT 


TTAATAAGTA 


CAGCAGCGGG 


AATAGGATTA 


1320 


ATT A ATTT AT 


Tf!J.f^ f^^T^P R IT 

1 Vjv~k.l 1 1AA1 


uAALulj lu 1 G 


1 l'l"A^l"l'AAGA 


CGAATGATTT 


AACCTTAACG 


1380 


TTAAGTGTTT 


ATATfiATTAr 


GG 1 UA 1 1 x\d 1 


GTATCGTTAA 


TTATGATGGA 


TATGGCATTA 


1440 


TTACAAGCGC 


AACATGCTGT 


cz A g a rrr a tt 


X 1 ivji ITJGiA 


TGACGGCAGG 


ATTGGTTATT 


1500 


AAATTTATAC 


TTAATATCAT 


TTTO A TTf C1T 

X X X \Jf\ X IVOl 


TTA AOTY2T1P A 


TTATTGGTGC 


GAGCATTAGT 


1560 


ACTGTTGTAT 


CATT AATT A T 


ATTCGGTACG 




TTGCTGTCAC 


GAGAAAATAC 


1620 


CACTTATATG 


CGATGAGACG 


ATTTTTTATC 


AATfiTTfJTTT 


TAGGTATGGT 


ATTTATGTCG 


1680 


ATTGTTGTTC 


AATGCGTGTT 


AAACATAGTG 


ACAACAf!ACG 


GTAGAATCAC 


TGGACTCATT 


1740 


GAATTATTAT 


GTGCAGCAGT 


ATTAGGTATC 


A' 1 " 1 'G f ATTGT 

H A VJwll 1U1 


TTTTCTATAT 


TTTTAGATTT 


1800 


AATGTTTTGA 


CATATAAAGA 


GTTAACTTAT 


TTACCATTTG 


GTTCAAAGTT 


GTATCAAATT 


1860 


AAGAAAGGAA 


GACGTTGATG 


GCACATACCA 


TTACGATTGT 


TGGCTTAGGA 


AACTATGGCA 


1920 


TTGATGATTT 


GCCGCTAGGG 


ATATATAAAT 


TTTTAAAGAC 


ACAAGATAAA 


GTTTATGCAA 


1980 


GAACGTTAGA 


TCATCCAGTT 


ATAGAATCAT 


TGCAAGATGA 


ATTAACATTT 


CAGAGTTTTG 


2040 


ACCATGTTTA 


TGAAGCACAT 


AACCAATTTG 


AAGATGTCTA 


TATTGATATT 


GTGGCGCAAT 


2100 


TGGTTGAAGC 


TGCTAATGAA 


AAAGATATTG 


TCTATGCGGT 


TCCGGGTCAT 


CCTAGAGTTG 


2160 


CTGAGACAAC 


TACAGTGAAA 


TTACTGGCTT 


TAGCAAAGGA 


CAATACTGAT 


ATAGATGTGA 


2220 
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10 



15 



20 



ATGATGGCTT CACACTGTTA GATGCGACAT CATTACAAGA AGTAACACTT AATGTTAGAA 2340 

CGCATACATT GATTACGCAA GTTTATAGTG CAATGGTTGC TGCTAATTTG AAAATCACTT 24 00 
TAATGGAACG ATATCCTGAT GATTACGCTG TTCAAATTGT CACTGGTGCA CGAAGCGATG ~ 2460 

GTGCGGATAA CGTTGTGACA TGCCCATTAT ATGAATTGGA TCATGATGAA AATGCATTCA 2520 

ATAATTTGAC GAGTGTATTC GTACCAAAAA TCATAACATC GACATATTTG TATCATGACT 25 BO 

TTGATTTTGC AACGGAAGTG ATTGATACTT TAGTTGATGA AGATAAAGGT TGTCCATGGG 264 0 

ATAAAGTGCA AACGCaTGmA AcgCTAAAGC GTTATTTACT TGAAGAAACA TTTGAATTGT 2700 

TCGAAGCTAT TGACAATGAA GATGATTGGC ATATGATTGA AGAACTAGGA GATATTTTAT 2760 

TACAAGTGTT ATTGCATACT AGTATTGGTA AAAAAGAAGG GTATATCGAC ATTAAAGAAG 2820 

TGATTACAAG TCTTAATGCT AAAATGATTC GTAGACACCC ACACATATTT GGTGATGCCA 2880 

ATGCTGAAAC TATGGATGAC TTAAAAGAAA TTTGGTCTAA GGCGAAAGAT GCTGAAGGTA 2940 

AACAGCCAAG AGTTAAATTT GAAAAAGTAT TTGCAGAGCA TTTTTTAAAT TTATATGAGA 3000 

AGACGAAGGA TAAGTCATTT GATGAGGCCG CGTTAAAGCA GTGGCTAGAA AAAGGGGAGA 3060 

25 GTAATACATG AGATTAGATA AATATTTAAA AGTATCACGG TTAATAAAGC GACGTACGCT 3120 

AGCAAAAGAA GTAAGTGATC AAGGTAGAAT TACAATAAAT GGTAATGTTG CTAAAGCTGG 3180 

ATCGGATGTT AAAGTTGAAG ATGTGCTGAC GATTCGCTTT GGTCAAAAAT TAGTAACAGT 324 0 

TAAAGTAACT GCATTAAATG AACATGCATC TAAAGATAAC GCGAAGGGTA TGTATGAAAT 3300 

CATTGAAGAG CGTCGACTTG AAGAAGCGTA AATTGGAGGT GACAAGCAAT GAAAAATAAA 33 60 

GTAGAACATA TAGAAAATCA GTACACGTCG CAAGAGAACA AGAAAAAACA ACGTCAAAAA 34 20 

ATGAAAATGC GTGTTGTTCg TAGGCGTATT ACAGTATTTG cGGGCGTATT aCTTGCGATA 34 80 

ATTGTTGTTT TATCaATCTT GCTTGTTGTC CAAAAACATC GCAATGATAT TGATGCACAG 354 0 

GAGCGAAAAG CGAAAGAAGC ACAGTTTCAA AAGCAACAAA ATGAAGAAAT TGCGTTAAAA 3600 

GAAAAGTTGA ATAATCTGAA TGACAAAGAT TACATTGAAA AAATTGCGCG TGATGATTAT 3660 

TACTTAAGCA ACAAAGGTGA AGTGATTTTT AGGTTGCCAG AAGACAAAGA TTCGTCTAGC 3720 

TCAAAATCTT CGAAAAAATA AATCCAAATT GATTCAAAAT TATCCGAGTA TAGACATTGT 3780 

GAAAAAA 3787 
{2} INFORMATION FOR SEQ ID NO: 376: 

50 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1644 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

55 



30 
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(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 376: 

5 TAAACCATTT CAAACTGAGG AACGCnAAGA CGGsACgTTT CCAGATTTAG AAGTATTTAA 60 

AAATGAATGT GATTTAAGCT ATGACATAAC GTCACTTTAT ACTTTTAAGC AACCTGTATC 120 

ACCACACCTT GCATTTAAAA TGACAGATCA AATTTTTCTA AATAAGCAGC GTGTATTAGA 180 

10 

TAAGGTAAAA GTTTTAGATA AGGAATTTGA TTTTATCTTA ATTGAGGGTG CTGGGGGAAT 24 0 

TGCCGTACCA ATATATGAAG GTACAGATGA TTTCTACATG ACTAAAGATC TAATCAATGA 300 

TTGTGCAGAT TGTGTCATCA GTGTGTTGCC ATCAAAATTA GGTGCTATTA GCGATGCCAT 360 

15 

TGTTCACCAA GATTATGTTA ATCAGAATGT ATCGGCGAGT AATTTTTTAA TAATGAATCG 420 

CTATACAGAC AGCTATATTG AAAAAGACAA TCAAATGACG ATTGGAAAAT TAACAAATAA 4 BO 

20 AACAGTCTAT ACATTTGAAG AACATGCCAC GTATGAAAAT TTCTCAGAAG CATTTTTAAA 540 

ACAATTAATA GGAGTTAAAA ATGAATTACA CACAACAACT TAAACAAAAA GACTCAGAAT 600 

ATGTTTGGCA TCCATTTACA CAAATGGGTG TATATAGCAA AGAAGAAGCA ATCATCATTG 660 

25 AAAAAGGAAA GGGTAGTTAC CTTTACGATA CGAATGGCaA TAAATATTTA GATGGTTATG 720 

CATCGTTGTG GGTCAATGTG CATGGTCATA ATAACAAATA CTTnAATAAG GTAATTAAAA 780 

AGCAACTCAA TAAAATTGCC CATTCTACGC TGCTAGGATC ATCAAATATT CCGTCAATAG 840 

30 AACTTGCGGA AAAATTAATC GAAATCACGC CAAGTAATCT AAGAAAAGTA TTTTATTCTG 900 

ATACAGGCAG TGCGTCTGTT GAAATCGCAA TAAAGATGGC ATATCAGTAT TGGAAAAATA 960 

TTGATAGAGA AAAATATGCC AAGAAAAACA AGTTTATAAC GCTAAATCAC GGTTATCATG 1020 

35 

GGGATACGAT TGGTGCGGTA AGTGTTGGTG GTATCAAGAC CTTTCATAAA ATATTTAAAG 1080 

ACTTAATATT TGAGAATATT CAAGTAGAAA GCCCATCTTT CTATCGCAGT AATTACGATA 114 0 

CTGAAAATGA AATGATGACA GCTATTTTAA CGAATATAGA GCAAATTCTA ATTGAAAGAA 1200 

40 

ATGATGAAAT CGCAGGGTTT ATATTGGAAC CGTTGATTCA AGGTGCGACA GGCTTGTTTG 1260 

TTCATCCTAA AGGCTTTTTG AAAGAAGTCG AGAAATTGTG CAAAAAATAC GATGTCTTAT 1320 

45 TAATTTGTGA TGAGGTAGCA GTTGGTTTTG GGAGAACTGG AAAGATGTTT GCATGCAATC 1380 

ATGAAGATGT TCAACCGGAT ATTATGTGTT TAGGTAAGGC GATTACTGGT GGCTACTTAC 1440 

CACTTGCAGC TACATTGACA TCTAAAAAAA TATACAATGC ATTTTTAAGT GATTCGCATG 1500 

50 GTGTGAATAC CTTTTTCCAT GGTCaTACAT ACaCCGGAAA TCAAATcGTT TGTaCGGTTG 1560 

cATTaGaAAA TATaAGaCTT TATGaAAAAC GTaAGTtnAT TGTgCACATa TTGaAACGaC 1620 
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(2) INFORMATION FOR SEQ ID NO: 377: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 431 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY : linear 



10 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 377: 

ATGATTTTtA aAAATCATTA AGTTAAGGTr GATACACATC TTGTCATATG ATCAAATGGT 60 

TTCGCCAAAA ATCAATAATC AGACAACAAA ATGTGCGAAC TCGATATTTT ACACGACTCT 120 

CTTTACCAAT TCTGCCCCGA ATTACACTTA AAACGACTCA ACAGCTTAAC GTTGGCTTGC 180 

CACGCmTTAC TTGACTGTAA AACTCTCACT CTTACCGAAC TTGGCCGTAA CCTGCCAACC 240 

AAAGCGAGAA CAAAACATAA CATCAAACGA ATCGACCGAT TGTTAGGTAA TCGTCACCTC 300 

CACAAAGAGC GACTCGCTGT ATACCGTTGG CATGCTAGCT TTATCTGTTC GGGCAATACG 360 

aTGCCCATTG TACTTGTTGA CTGGTCTGat ATCcGTGAGC AAAAACGGCT TATGGTnTTG 420 

25 CGAGCTTCAG T 431 
(2) INFORMATION FOR SEQ ID NO: 37B: 



15 



20 



30 



35 



45 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2006 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 378: 

TTTnTATAAC GTATTATAAA TCGTTAAAAA TTTTGGTTGT GTTTGCGTCA CGTAGACAAC 60 

. CTCCATAAAG TTACTTAATC ACTCTCATCA TACAATAATT TTTACTCAAA TTGGAAnAAT 120 

TATAAAAATT AAATATAGAT AGGCTTTGAA AATTAGTTTT ATACAAGGTT AGTAGCTGTA 180 

ACTGTAAAAT GTTCTTAATA TTGTCAAAAT GTAATGCTTG AAAGCGCTTT TAAAaAATAT 240 

TATTATATAC ATGGTTAGAC AAATAGACAA ATCACTATAC AAATATTGGG AGGAATATTT 300 

TATGAAATCA ACACCACACA TTAAACCAAT GAATGACGTC GAAATTGCAG AAACGGTTCT 360 

ATTGCCAGGA GATCCGTTAA GAGCTAAGTT CATTGCAGAA ACTTATTTGG ATGATGTGGA 420 

SO ACAGTTCAAT ACAGTGCGAA ACATGTTTGG TTTTACCGGA ACATATAAAG GTAAAAAAGT 4 80 

TTCTGTCATG GGTTCAGGTA TGkGTATGCC ATCTATTGGC ATTTACTCTT ATGAATTAAT 540 
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CATTGATTTA TATGATGTGA TTaTTkCACA AGGTGCCTCT ACTGATTCAA ATTACGTTCA . 660 

ACAATATCAA TTACCAGGTC ATTTTGCGCC AATTGCTTCT TATCAATTAT TAGAAAAAGC 720 

AGTTGAAACA GCACGTGACA AAGGTGTACG TCATCATGTA GGTAATGTGT TATCAAGTGA 780 

TATTTTCTAT AACGCGGATA CAACAGCGAG TGAACGTTGG ATGCGTATGG GTATTTTAGG 840 

TGTAGAAATG GAATCaGCTG CaTTATACAT GaATGCAaTT TACGCTGGTG TCGAAGCATT 900 

AGGTGTGTTC ACAGTGAGCG ATCATTTAAT TCATGAAACG TCAACAAcAC CTGAGGAAAG 960 

GGAACGTGCA TTTaCAGATA TGATTGAAAT TGCACTGTCA TTGGTGTAGA TGATTATGAA 1020 

TGTTGAATAT TCTAAAATAA AGAAAGCAGT ACCTATTTTA TTATTCTTAT TTGTATTCAG 1080 

TTTGGTTATA GACAACTCAT TTAAATTGAT TTCTGTAGCC ATTGCTGATG ACTTAAACAT 1140 

ATCTGTAACG ACAGTAAGTT GGCAAGCGAC ATTAGCCGGT TTAGTAATTG GTATTGGCGC 1200 

TGTAGTATAC GCTTCATTAT CTGATGCCAT TAGTATACGC ACACTATTTA TTTATGGCGT 1260 

GATATTAATC ATTATCGGAT CAATTATTGG TTACATTTTC CAACATCAAT TCCCATTACT 1320 

TTTAGTTGGA CGTATTATTC AAACTGCCGG TTTAGCTGCT GCAGAGACAT TATATGTGAT 1380 

ATAT0TTGCA AAGTATCTTT CTAAAGAGGA CCAGAAGACT TACCTTGGCT TAAGTACGAG 144 0 

CAGTTATTCC TTGTCATTAG TTATCGGTAC ATTATCAGGT GGAT^TATTT CTACGTATTT 1500 

ACACTGGACA AATATGTTTT TAATTGCATT AATCGTAGTA TTTAGGTTGC CATTGCTATT 1560 

30 TAAATTATTA CCAAAAGAAA ATAATACGAA TAAAGCTCAT TTAGATTTTG TTGGCTTAAT 1620 

TCTAGTGGCA ACTATTGCTA CAACAGTCAT GCTGTTTATT ACGAACTTTA ATTGGTTATA 1680 

TATGATTGGT GCCTTAATTG CGATTATCGT TTTTGCGCTA TATATTAAAA ATGCGCAACG 174 0 

35 TCCATTAGTA AATAAATCAT TTTTCCAAAA TAAACGTTAT GCTTCATTTT TATTTATAGT 1800 

ATTTGTAATG TATGCTATCC AATTGGGTTA TATTTTTACG TTCCCATTCA TAATGGAGCA 1860 

AATTTATCAT CTGcAACTAG ACACAACATC ACTGTTATTA GTACCGGGgT TaTATAGTAG 1920 

CAGTCATTGT TGGtGgCACT AAGTGGgTtA AAATCGGgCG rAATATCTGG AATTCCAAAA 1980 
CCAAGCGGAT TATCACAGCC AATTAA 
(2) INFORMATION FOR SEQ ID NO: 379: 



10 
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20 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4858 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



2006 
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TGGGGAAAAA AAGACCCAGC AGTATTAGAA 

AATCGTATCA TAAAATTAGT CGAAGAATTA 

5 

ATTTCTTCTG AAGCACAGAC CGTGCATATT 

TTAAAACAAT TGCATCCTGA TTATCAATTT 

ATTAAAATGA AACCTCATCA ATTCGAACAA 

10 

AAATATGATG TGAAGAATAA GAAAATTAAA 
ATAATTGAAA TTACAGATCA TGGAATTGGT 

1$ GATCGCTTTT ATCgAGTGGA TAAATCTCGT 

TTATCTATTG CTCAAAAAAT CATTCAATTA 
ATTAACAAAG GAACAACGTT TAAAATCATA 

20 TCATAGGATC AATTTTTTAA GTACACATTA 

AACAAATAAA CAGTGGTTCT TTATCATTTC 
CATCTATAAA CCTAGAAGAA TCAACGCTTT 

25 

GTAAATCTAC TTTAACAAAT AACTAAATAG 
TTTTTGTGGA GGGTGTAAAA TGACTAACGA 
CTTCGGTGCG AATTTAGGTC TAATGTTAGA 

30 

ATCTGTACCA GAAGATTTAC AAGTCTTATT 
ACCAGCTTTA AAAAGTACAA GTAGTCAAAA 

35 TTTAATTGAT AATATTCGCC AATACGGGCA 

TCCAAAAAGG AAACATGTAC CTAAATTAGA 
TTTGGAAGGT ATATCAGCAG GAATTGTTTC 

40 TTATGAAGCA ATTTTAAGAA TGGAAAAACG 

ACATATTAAT AACAATACCG AACGTGGTTG 
AGTAACGTTA AATAATAACG AAAAAAGGGC 

45 

GTTTGAAAAA TATCTTCATA AAAACTTCGT 
AGACGCACTT GTACCGATGT TACAACGTAC 
AAATATACAA ATAGGCATGG CTCACCGTGG 

50 

AAAACCGTAC GAAATGATGA TTTCAGAATT 
TGAAGATGGT AGCTTGCAGT TAACTGCTGG 

55 



GAATCGTTAA ATATTTCTAT TGAAGAAATG 60 

CTTGAATTGA CTAAAGGAGA TGTAAATGAC 120 

AATGATGAAA TTCGCTCGCG AATACACTCA 180 

GATACGGATC TGACATCTAA AAATCTAGAA 240 

TTATTTTTAA TCTTTATTGA TAATGCAATC 300 

GTTAAGACAA GGTTAAAAAA TAAGCAAAAA 360 

ATTCCAGAGG AAGATCAAGA TTTCATTTTT 420 

TCAAGAAGTC AAGGCGGTAA TGGACTCGGA 480 

AACGGAGGAT CGATTAAAAT TAAAAGTGAA 54 0 

TTTTAATCAT GACTGAGACG TCAATCAAAG 600 

GCTGTGACTA ATGTATAAGA ACAACTATAA 660 

TGTTGTACTC CCAAAATTTA CAATAAAATA 720 

TGTTGATTCT TCTTTTTAGC AGATAAATAG 780 

TGATATTATT ACATTGTAAG CGTTTCAACA 84 0 

AAGAAAAGAA GTTTCAGAGG CTCCTGTAAA 900 

TCTATATGAT GACTTTTTAC AAGATCCATC 960 

CAGCACAATT AAGAATGATG ACTCAATTGT 1020 

TAGCGACGGC ACAATTAAGC GTGTCATGCG 1080 

TCTTAAAGCC GATATTTATC CTGTAAATCC 1140 

GATTGAAGAC TTTGATTTAG ATCAACAGAC 1200 

AGATCACTTT GCCGACATTT ATGATAATGC 1260 

TTACAAAGGA CCAATTGCAT TTGAGTATAC 1320 

GTTAAAAAGA AGAATTGAAA CGCCATATAA 1380 

ACTATTCAAA CAATTAGCGT ATGTTGAAGG 1440 

TGGTGCAAAG CGTTTTTCAA TTGAAGGGGT 1500 

TATTACGATT GCTGCGAAAG AAGGTATTAA 1560 

ACGTTTAAAC GTTTTAACGC ATGTCTTAGA 1620 

TATGCATACA GATCCAATGA AATTCTTACC 1680 

ATGGACTGGT GATGTGAAAT ATCACCTTGG 1740 
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AAGTCACTTG 


GAAATTGTTG 


CACCTGTTGT 


TGAGGGGCGT 


ACGAGAGCAG 


CACAAGATGA 


1860 




TACACAACGA 


GCTGGGGCTC 


CGACGACTGA 


TCATCATAAA 


GCAATGCCAA 


TTATTATACA 


1920 


5 


TGGCGATGCT 


GCTTATCCTG 


GTCAAGGAAT 


TAACTTCGAA ACAATGAACT 


TAGGAAACTT 


1980 




GAAAGGCTAT 


TCTACGGGTG 


GTTCATTGCA TATTATTACT AACAATAGAA TTGGATTTAC 


2040 


10 


TACAGAACCA ATTGATGCAC 


GTTCAACAAC 


TTATTCTACA 


GATGTGGCCA 


AAGGTTATGA 


2100 


TGTGCCAATA TTCCATGTCA ATGCAGATGA CGTTGAAGCT ACTATTGAAG 


CAATTGATAT 


2160 




TGCAATGGAA TTTAGAAAAG AGTTTCATAA AGACGTCGTT ATTGATTTAG 


TAGGTTATCG 


2220 


15 


TCGTTTCGGA 


CATAACGAAA 


TGGATGAACC 


ATCAATTACT AATCCaGTTC 


CTTATCAGAA 


2280 




TATTCGCAAA 


CATGACTCTG 


TTGAATATGT GTTTGGTAAA AAGCTTGTTA ATGAAGGTGT 


2340 




CATTTCAGAA 


GATGAAATGC 


ATTCATTTAT 


AGAACAAGTC 


CAAAAGGAAP 




2400 


20 


TCATGATAAA 


ATTAATAAAG 


CTGATAAAAT 


GGATAATCCA 


GATATGGAAA 




2460 




TCTTGCATTA 


CCGTTACAAG 


CAGACGAACA 


ATCATTTACT 


TTTGATCACT 


TGAAAGAAAT 


2520 




AAATGATGCA 


TTGTTAACAT 


ATCCGGATGG 


CTTTAACATT 


TTGAAAAAGT 


TAAACAAAGT 


2580 


25 


TCTTGAGAAG 


CGTCATGAGC 


CGTTTAATAA 


AGAAGATGGT 


TTAGTTGATT 


GGGCACAAGC 


2640 




AGAACAACTT 


GCATTTGCGA 


CAATTTTACA 


AGATGGTACA 


CCGATTCGCT 


TAACTGGTCA 


2700 


30 


AGATAGTGAA 


CGTGGTACAT 


TCAGTCATAG 


GCATGCCGTG 


TTACATGATG 


AGCAAACAGG 


2760 




TGAAACATAT ACACCTTTAC ATCATGTTCC 


TGATCAAAAA 


GCGACATTTG 


ATATACACAA 


2820 




TTCTCCGCTT 


TCAGAAGCAG 


CAGTAGTTGG 


TTTTGAATAC 


GGCTATAATG 


TGGAAAACAA 


2880 


35 


AAAAAGCTTC AATATTTGGG AAGCACAATA TGGTGATTTT 


GCAAATATGT 


CACAAATGAT 


2940 




TTTTGACAAC 


TTCTTATTCA 


GTTCTCGCTC 


AAAATGGGGA 


GAACGTTCAG 


GATTAACATT 


3000 




ATTCTTACCT 


CATGCATATG 


AGGGTCAAGG 


GCCTGAACAT 


TCATCAGCAA 


GATTAGAGCG 


3060 


40 


ATTTTTACAA 


TTAGCTGCTG 


AAAATAATTG 


CACAGTTGTC 


AACTTATCTA 


GTTCAAGTAA 


3120 




TTATTTCCAC 


TTATTGCGTG 


CACAAGCGGC 


TAGTTTAGAT 


TCTGAACAAA 


TGCGACCATT 


3180 


45 


GGTTGTTATG 


TCACCAAAAA 


GCTTACTGAG 


AAATAAAACA 


GTTGCAAAAC 


CAATTGATGA 


3240 


ATTTACTTCT 


GGTGGATTTG 


AGCCAATTTT 


GACAGAATCA 


TATCAAGCGG 


ATAAGGTTAC 


3300 




AAAAGTTATT 


TTGGCAACTG 


GTAAAATGTT 


CATTGATTTA AAAGAAGCAT 


TAGCTAAAAA 


3360 


SO 


TCCAGACGAA 


TCAGTATTAC 


TCGTTGCGAT 


TGAAAGATTG 


TATCCATTCC 


CAGAGGAAGA 


3420 




GATTGAAGCA 


TTACTAGCAC 


AATTGCCAAA 


CCTTGAAGAA 


GTGTCATGGG 


TACAAGAAGA 


3480 




ACCTAAAAAT 


CAAGGTGCAT 


GGTTATATGT 


CTATCCATAT 


GTTAAAGTGC 


TAGTTGCAGA 


3540 
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AGAAATTCAT AAACTTGTTC AAAATAAAAT TATAGAAAAT GCATTAAAAA ATAACTAGGG 3660 

GGAAATAAGT CATGCCAGAG GTTAAAGTTC CAGAATTAGC AGAATCTATT ACAGAAGGTA 3720 

5 CCATTGCAGA ATGGTTGAAA AACGTAGGGG ATAGCGTAGA AAAAGGTGAA GCTATTCTTG 3780 

AATTAGAAAC TGATAAAGTT AATGTCGAAG TTGTATCTGA AGAAGCAGGT GTATTATCTG 3840 

AACAACTTGC AAGTGAAGGC GACACTGTAG AAGTTGGACA rGCAATTGCT ATCATCGGCG 3900 

10 

AAGGTAGTGG CAATGCTTCT AAAGAAAATA GTAACGACAA TACTCCACAA CAAAATGAAG 3960 

AAACAAATAA TAAAAAAGAA GAAACAACAA ATAATTCGGT AGATAAAGCT GAAGTAAATC 4020 

AAGCAAATGA TGACAATCAG CAACGTATTA ATGctACGCC TTCTGCGCGT CGATATGCTC 4080 

GTGAAAATGG TGTGAATCTT GCTGAAGTAA GTCCGAAAAC AAATGATGTG GTTCGTAAAG 4140 

AAGATATTGA TAAGAAACAA CAGGCACCGG CATCAACACA AACAACACAA CAAGCATCTG 4200 

20 CAAAAGAAGA GAAAAAATAC AATCAATATC CTACAAAACC AGTGATTCGT GAAAAAATGT 4260 

CACGTAGAAA GAAAACAGCT GCCAAAAAAT TATTAGAGGT ATCTAATAAT ACAGCTATGT 4320 

TAACAACATT TAACGAAtTG AcATGACAAA TGTTATGGAA TTGCGTAAAC GTAAGAAAGA 4380 

25 ACAATTTATG AAAGATCATG ATGGTACTAA ATTAGGATTT ATGTCATTCT TTACTAAAGC 4440 

TTCTGTAGCA GCTTTGAAAA AGTATCCAGA AGTTAATGCA GAAATCGACG GCGACGACAT 4500 

GATTACGAAA CAATATTATG ATATTGGTGT AGCTGTTTCT ACAGATGATG GATTATTAGT 4560 

30 

ACCATTTGTA AGAGATTGTG ATAAAAAGAA TTTTGCAGAA ATCGAAGCAG AAATTGcTAA 4620 

TTTAGCAGTT AAAGCaCGAG AGAAAAAACT TGGCTTAGAT GATATGGTTA ATGGTTCATT 4680 

3S TAOGATTACA AATGGCGGTA TTTTTGGATC AATGATGAGT ACGCCAATTA TCAATGGTAA 4740 

TCAAGCTGCA ATCTTAGGCA TGCATTCAAT TATTACAAGA CCAATTGCGA TTGATCAAGA 4 800 

TACAATCGAA AATCGTCCAA TGATGTATAT TGCATTAAGC TATGATCATA GAATTATT 4B58 

40 (2) INFORMATION FOR SEQ ID NO: 380: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2222 base pairs 

(B) TYPE: nucleic acid 
45 (C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

ixi) SEQUENCE DESCRIPTION: SEQ ID NO: 380: 

50 

ATCAGTCACA CGGTAGGCAT ATAAAATGAG TCGTTTCTAC AACATTTTTA AACAGTTCAT 60 
TCAATATTAT TTTTATCTAA TAATnATATT GGGAGGATTA TACCTTTATA CACACCATGC 120 

55 
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ATGCTATTTA GCTAAAGCTA AAAGACCAGA CACTATGCAT ATTTCAACTG GAAATATGTG 240 

GCGATACTTA GTTGCAATTA TTGCCTGTAT GATTTGGTAC CTTAATAAAG CGCATGTAAG 300 

TATCATCGGT ATAATTATTG GTTTAATGAT TTCATATGTT GTAGTTATCA TACGTCCTTT 360 

ACTAAAGGTG AGCAAATAAA TTAAGAAAGA. GGTGAGATTA TGGATCACAA ATCCCCGCTC 420 

GTGAGTTGGA ATTTATTCGG TTTTGaTATC GTTTTCAATT TATCAAGTAT ATTGATGATA 460 

CTTGTTACGG cGTTTCTTGT TTTTCTACTT GcTATCATTT GTACGCGTAA TTTGAAAAAA 540 

AGACCAACTG GCAAACAAAA TTTCGTTGAA TGGATTTTTG ATTTCGTGAG GGGAATCATT 600 

GAAGGTAACA TGGCTTGGAA AAAAGGTGGT CAATTCCACT TCTTAGCAGT AACGCTGaTT 660 

CTGTACATTT TTATAGCTAA TATGTTAGGT CTTCCGTTTT CTATAGTAAC GAAAGATCAC 720 

ACATTGTGGT GGAAATCACC GACAGCnGAT GCAACAGTGA CTTTAACGTT GTCTACAACG 780 

20 ATAATACTGT TAACTCACTT TTATGGAATT AAAATGCGTG GTACGAAACA ATATCTTAAA 840 

GGTTATGTAC AGCCGTTTTG GCCATTGGCA ATTATTAATG TTTTTGAAGA GTTCACTTCA 900 

ACATTAACGC TTGGTCTGCG TTTGTACGGT AACATATTTG CAGGTGAGAT ACTATTAACA 960 

TTACTTGCTG GCTTATTCTT TAACGAACCA GCATGGGGTT GGATTATTAG TATCCCAGGA 1020 

TTAATTGTTT GGCAAGCATT TTCAATATTT GTAGGAACAA TCCAAGCATA TATCTTTATT 1080 

ATGCTTTCGA TGGTTTATAT GTCACATAAA GTGGCAGATG AACACTAAAA ATTTCAATAA 1140 

TTATATACAA TCACAGGAGG AAATTAAATT ATGAATTTAA TCGCAGCAGC AATCGCAATT 1200 

GGTTTATCAG CATTAGGAGC AGGTATCGGT AACGGTTTAA TCGTTTCAAG AACAGTTGAA 1260 

GGTGTAGCAC GTCAACCAGA AGCACGTGGT CAATTAATGG GTATCATGTT CATTGGTGTA 1320 

GGTTTAGTTG AGGCATTACC TATCATCGGT GTAGTAATTG CATTCATGAC ATTTGCTGGA 1380 

TAATTAACAG ATAAAAGAGG TCGGGACAAA GCGCATAGGA CATAATTCAT GATGCATATA 1440 

40 TAGTAATATC TTTGAACTTT ATTAAATAGT TGAGATATGA ACGCACCATG CCTATCGCAT 1500 

AAATTCAGTA GGTCCTAACC TCGTCGTTTT TTTCTATATA ACACTAGCGA TTATTTTAAT 1560 

GAAAGGAGTG TCATGAACCC GTGACTGAAA CAGCTAACTT ATTCGTTCTT GGTGCAGCTG 1620 

GAGGCGTTGA GTGGGGTACT GTGATTGTAC AGGTCCTAAC TTTCATCGTG TTAcTTGCGT 1680 

TACTTAAAAA GTTCGCATGG GGTCCATTGA AAGATGTAAT GGATAAACGT GAAAGAGATA 1740 

TTAACAGAGA TATCGATGAC GCAGAACAAG CTAAGTTAAA TGCACAGAAA CTTGAAGAAG 1800 

AAAATAAACA AAAACTTAAA GAAACACAAG AAGAAGTTCA AAAGATTTTA GAAGATGCTA 1860 

AGGTTCAAGC ACGTCAACAG CAAGAACAAA TTATTCaTGA AGCAAACGTA CGTGCAAACG 1920 
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TTAATAATCa AGTATCTGAA CTATCAGTGT TAATTGCTTC TAAAGTTCTT AGAAAAGAAA 



2040 



TTTCTGAACA AGACCAAAAA GCATTGGTTG ACAAGTATCT AAAAGAGGCA GGCGATAAAT 



2100 



AATGGTAAAA GTAGCTAACA AGTATgcTAA AGCATTATTT GACGTGTCAT TAGATACAAA 



2160 



TAATTTAGAG ACTATTAATG AAGAATTAAC AGTTATAAAT GAAGCAGTAA AAGATAAAAT 



2220 



TO 



2222 



10 



15 



20 



25 



30 



35 



40 



45 



50 



(2) INFORMATION FOR SEQ ID NO: 381: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1143 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 381: 

TAACAATTCC TaTATTCATG TTTAATACGA AACACTACAT TTACATTGTA ATTCACTATC 60 

TTTTGAAGTA ATAAAGTGAT TTGTTCAATC GATAGCTCAT TGCTTGTGTC GATTGTAACA 120 

ATTATATGCA AGTTTTCAGG ATTAACACCT AATCTTTGAA TGATTTGTTT AATAGTATAA 180 

TAATCCATCC AATAAAAATT ACTTCCTTTA ATATAAATGT TTTTAGGTTG ATACATTTGA 240 

CTCCTTTTTG TAGGCTCAAA AGGTATATCA ATCTCGCGCA TACTTGAAGA ACTTTGATTA 300 

GTATCATCAA ATAATTCAAT TATATTTTTA TCAATTTCAA CTAATTGGGA ATGGTTAATT 360 

GAATGAGATG TTGGACTATA TCTTTTTCTA ATTAATTTAG GAGTGTTACC ATACGTTTCT 420 

TTAAAGAGGT GTATAAAACG AGAATAATGA TTAAAACCAT GACTACTTGC GATTTCTTCA 4 80 

ATAGGCTTCT TAGrAGTTAA AATATCAATT AAGCAATGCT CCAGTCTAAT ATGATTTAAA 540 

TATTGAATAA AATTACTATA AGGTGTCGCT TTAAACATGT CACTTAAAGC TTTGTTTGTA 600 

ATACTAACTT GATTAATGAC ATCTTTCCTA TTTATCTTTT TATGGTGGTT GTTTGTTAAA 660 

TAATCGTGCA CTTCTTCGGC TACTAAATGA CGACTACCAT CGTATGTATT TAATGACATT 720 

AATTCAACAC ACATGTAATT AATAATCTTA TCATTAGCAT TATAAGACTG TTGTTTAATT 780 

TTGCTGTAGA TTAAATACTT AATCAAGATT CTAAAAGTGC TAGCAACCTC ATTTGTTAAT 840 

ATCTTGCCAC G CAT CAT AT A GTTTGCATTC ATAAACTTCA AAAATGTCTT TGCACTTACT 900 

TCAACAACAC AACATACACT ATCATCATTA CCATCAATTT GATACAAATC ATTCAACATA 960 

ATAATGGTGA CATCATTTCT TTTTACATCA TATTGTTGTA GATTGATTGA AACTACACCT 1020 

GTACCTTGTA GCCAATATAT AATTTTtAAG TTCGCTTCCT TCACACTACT CATTTTCATA 1080 
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ATT 

(2) INFORMATION FOR SEQ ID NO: 382: 

5 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 506 base pairs 
<B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



1143 



10 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 382: 

GGACCACCTT TTTTACCTGT ACGACTAAAG CCAACTGTTT TAAAGGCACC AACAGCATGC 60 

15 

CACACTTGAA TAATTTCTTG TGATGGTCTA AAGCGAACCG TATAAATTAA TGGATGGAAA 120 

TCATCAACAA AAATATAATC GGCCTTACCA AGTAAATATG GCAATCTAAA CTTGTCTCTC 180 

2Q CATTTGCGTC TATCCGTAAT ATTCTCCTTA AATACCGTTT TAATATCATA ATCAAAATCT 24 0 

ACTTTTTGGC GTAGTAACTC ATCATATACA TACTTGAAAT TCCCTGATAA ATTCGGACGC 300 

GAATCTGATG TGAATAATAT TGTTTTGCTT CTTTTAATAT GTAGTAACTT TGTAATATTA 360 

25 AAAATAGCTT TAAATAAGAA ACTTCTACTT TCAAATGAAG CTTTATGaCC TTGTTTaTGA 420 

AGCCAGTGTG cACTTgTCGC AATGaCCCCT GaTTTCyCyT GagGtAAGGk GaTTTCmATA 480 

TCAAATACAA ATTCGTTAAC GTCACT 506 

30 

(2) INFORMATION FOR SEQ ID NO: 383: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 421 base pairs 

(B) TYPE: nucleic acid 
35 (C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 383: 

40 

AGCATCTGCA AtGAGTcTCT AATACAACGA TACGTTTTGC ATCTTTAGGT ACTTTTACTG 60 
TACCATTTTC ATCTTTTACC GAAATAGTAT CTTTAGTTGA TGATTCTTTT TTACTTGAAT 120 
45 TATCCGTATT ACCACAAGCT GCAACTAAAA GTAAGGCAAC TATTAATCCC AATATACTAA 180 
AAGTTTTTAG ACCTCTCATC GTTCCACTCC TTAATATGTA TAACTTCATT TATTATTTTA 240 
TTGATAACAA TTATCATTGT CAAGTAGCGT TCAATCTTTT TTATATTTCT AAAATGTATG 300 

50 

ACTATATATT TCCTCTAATA ATTATGACTA CAATTAGCAC ATTTCCTTAG ACAAAATACT 360 
GATAATGTAT CATTGCTATA TCATCTTTGC ATTAATACAA TTGACACCAT TTAGCATGAC 420 

55 
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(2) INFORMATION FOR SEQ ID NO: 384: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 862 base pairs 
s (B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



15 



20 



10 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 384: 

TGCACTTGAT ACTTTAGCAC ATGAAATTGC TAATCGATTA GTTGCAAATG ACAAGAATGA 60 

AGCAACTTTG GAAATGACTA ATAAAATGGC AACGATTCGT TTTACAGAAC CTACGCTGAT 120 

TGCATTAGCA GGGGGTAATG TCAAAGCTTA CACTGAGCAT ATGACTATAT CTCCATATAA 180 

ATTGTATTTG TTAGATAAAG GCGATGTTTT AAAGTTTAGA GAAACAAGTT ATACATCGCG 240 

AGTGTATTTA GCTGTgGGAG GCGGATTTGA ATTAGATGCA TGGTTAGGAT CTAACTCAAC 300 

CGACTTTAAT GTAAAAATTG GTGGTTTTAA AGGTAGAACA TTACAAGATG GCGATGAAAT 360 

AAAGCTTAAG AGAGATTATA CAGCTCGTCA TCATAAGTTA TTTGAAAACC TTGCTCACAC 420 

25 GAAACAAACA GATTGGGGTA TTGATGGATA CGCCTTGTCA TTTAATTATA TGTCTGATGT 48 0 

ATTTCATGTC GTTAAAAATA AAGGTACGGA AGATTTTAAA GAAGATGCCA TTCAAAGATT 54 0 

TGTGAAACAT GATTATAAAG TAACGAGCAA AGCAAATCGC ATGGGGATGA TGCTTGAAGG 600, 

TGAAAAAATC AAAGCTTTTT ATGAAGATAT GCCACCGTAT CAGACTGTCA AAAAAGGAAC 660 

GATACAAATT AAGCGTGATG GCACACCTAT TATCCTATTA AATGATCATT ATACGCTAGG 720 

TAGCTACCCG CAAATCGGTA CAATCGCAAG TTATCATTTA ACGAAATTAG CACAAAAACC 780 

GCAAGGATCA CGTTTGAAAT TTCAATTTAT AGATATTTTA ACGGCTGAAA AGAACCTTGT 840 

TAAgTATAGT AACTGGTTAA AC 862 
<2) INFORMATION FOR SEQ ID NO: 385: 

40 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1027 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
45 (D) TOPOLOGY: linear 



30 



35 



50 



55 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 385: 
AAATGAGTTG ATGATGGCTC CTATTCCATC TATCTCTAGG TATGACAGAA SATAAACGGT 6 0 

CTTCTACCTG TCTsACATTA TCTTTCCAAC GATTAATACC TAAGCGTTTA GAAACACGTT 120 
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CAGTTTTACG 


TPPTAPAPPT 


GCTAAACTTT 


CTAATTCCTT 


ATGTGTTTGT GGTATTTCTC 


CATTAAATTG 


ATPA ATP A A A 


vATTGACAAA 


GTTTCTTAAT 


ATTCTTAGCT TTGTTACGAT 


ACAGACCGAT 


Af?AAPf2AATA 


T^TS T r P/~ l ATI\ ?\ 

TCATTCATAA 


GTTCTTCATC 


ACTGACTGCC AAATAATCTT 


CAGGCGTTTT 


Ulnl 11X1 l/\ 


AACAG CTCAG 


TTGTTACTCT 


ATTTACTAGA ACGTCTGTAC 


ATTGCGCTGA 


PA ATA ATA Pa 




ATTCGAACGG 


ATTATCATGT TTTAATTCAC 


ATTPTGCATP 


PfiTIA A APATa 


TTTGCTATAA 


CATCAATCAT 


TTCTAATGCT TTTTTCTTAC 


TTAC CATCAA 




GTTTAACCAA 


TCAAATTTAG 


GTACCGTTTT AACTGTGTGC 


flTP A TTTT Pf2 


«il I Al xGAA 


TTTTTCTCTT 


ATTTTTCTAG AATCGTCAAT TGTTTTGACA 


A X\J 1 llliLl 


1LLAA1 lAAb 


TAAAATACGA 


TCTATATATT 


TAAAGCTAAG TTTATTCAAA 


CTATTCGCCT 


CGTCTAATGC 


CGCTTGTATA 


ATTGCAGTAT 


CGTGTTTATC AACATCAATC 


CATTGATTTA 


ACGTTTCTAT 


TTCATATGGA 


GATAACGGCC 


TTGCAAATGT ATCCTCTAAA 


ACTCTAAATA 


ATTGTTTAAA 


TTTTTCTTTA 


CTATTTAGCT 


CTTTCGTTTC CATACTTTGT 


TGCTTCAATA 


TATGACTTAA 


TTTTTCGAAA 


AAAGGATCTA 


G ATT CAT AT A TTCGGkAAAT 


CTACCTTCyT 


CATCyTTTTG 


aACTkGtAAT 


tCTAGCAATT 


CACGTgTATC AAATTTTGGA 



TACCATT 

(2) INFORMATION FOR SEQ ID NO: 3 86: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1006 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 386: 
AAGGnTTGGA GGGAATTAAT nGATGGCAAA TCCCAGaTAA AGTACACaAC GCATGGAATG 
TGATGCATTT AATATTTCCA GTAGTTAGTA CGACGTTTGC AAGCTTTAAA TCTATGTATG 
GGGGCATACC AAAAGATTTC ATAGACTACT TATTTATTGA TGAAGCAGGA CAAGCAATAC 
CTCAAGCAGC TGTGGGAGCA TTATATCGTT CAAAAAAAGT TGTAGCTGTA GGTGATCCGA 
TTCAAATAGA ACCGGTTGTG ACTTTAGAAA GTCATTTAAT TGATAACATT CGTAAAAATT 
ATCATGTTCC GGAATATCTA GTTTCTAAAG AAGCTTCTGT GCAGTCTGTT GCAGACAACG 
CCAATCAATA TGGTTTTTGG AAATCTGATG CTACTGATAG TAATCAAAAA ACCTGGATAG 
GCATACCTTT ATGGGTGCAC AGACGATGTT TAAAACCTAT GTTCACGATa GCTAaCCAAa 
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70 



75 



30 



35 



45 



50 



55 



GGTATGACGT TAAAGGAAaC GCAGTTCAAA AACAATTTGT GAAAGAGCAT GGTGAAAAaG 600 

TAGTGGGATT ATTAGCTGAT GATTGGATTG AAGCAATTAA GGAAGGTAAA AATGAACCGA 660 

GCTCATTTGT AATATCGCCT TTTTCAGCAG TACAGCAACA GATTAAACGT ATGTTAAAGC 720 

AACAACTACC GACTAGAATT GATATTGAAC GTACAAAAAT TAATCAATGG GTCGATAAAT 780 

CCATTGGTAC TGTTCATACT TTTCAAGGTA AAGAGGCTCA GAAGGTGTAT TTTGTAATAG 840 

GTACTGATAA TACCCAAGAT GGTGCTGTGA ACTGGTCATG CGAAAAACCA AACTTGTTAA 900 

ACGTTGCAGT GACAAGAGCT AAGAAAGAGT TTaTGTAATT GGCGACATGC AAAGAATACA . 960 

GATGAaACCA TTTTATGAGA CGATTTTTAn AGnAAGAAAT GTAAAA 1006 
(2) INFORMATION FOR SEQ ID NO: 3B7: 



Ci) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 662 base pairs 
20 (B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



25 



. (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 387: 

CGTTTCATCA AGTnATCGAT CCTAATTTAC AAAATATTCC GGTTAGACTT GAAGAAGGGC 60 

GTAAAATAAG AAAAGCCTTT AAACCAACTT CAAAAGATAG CGTTATATTA TCAGCAGATT 120 

ATTCTCAAAT TGAATTGCGT GTATTAGCAC ACATTACACA AGATGAGAGT ATGAAAGAAG 180 

CATTTATCAA CGGCGATGAT ATTCATACAG CAACTGCTAT GAAAGTATTT GGTGTAGAAG 240 

CTGATCAAGT CGATAGTTTA ATGCGTCGTC AAGCAAAAGC AGTTAACTTT GGAATTGTTT 300 

ATGGGATAAG TGATTATGGT TTAAGTCAAA GTTTAGGTAT TACTCGTAAA AAAGCAAAAG 360 

CATTCATTGA TGATTATTTA GCTAGTTTCC CAGGTGTAAA ACAATATATG TCTGATATTG 420 

40 TAAAAGATGC CAAAGCTTTA GGTTACGTGG AAACATTGCT ACATCGTCGA CGCTATATTC 480 

CTGATATTAC GAGTCGTAAC TTTAATTTAC GCGGCTTTGC TGAACGTACT GCTATGAATA 540 

CGCCAATACA GGGCAGTGCT GCAGATATCA TTAAACTGGC AATGGTTAAA TTTGCTCAAA 600 

AAATGAAAGA GACAACATAT CAAGCTAAAC TATTATTACA AGTACACGAT GAATTAATTT 660 

TT 662 
(2) INFORMATION FOR SEQ ID NO: 388: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 669 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 388: 



5 



10 



15 



20 



TCATCCAAAT 


TTTGGAAATT 


CCACATTTTA 


CATATCGTAA 


TTTTTTAGGA AACTAGTGAA 


60 


TATAACAAAT 


CCCTCCTCTC 


ATTTTTAAAA 


TAGATATATC 


ACTTCCCCAC TTTTACTTAA 


120 


CTAAACTGCA 


ACGGTTCCTA 


ATACCAAAAT 


CCTGCCCTCT ATTTTTATCA ATTCAAGCAT 


180 


ACTTATTGAA 


AAATGTTAAC 


GTTTTCTTGA 


TAATCATTGT 


AAGCGCATTT ATTTTATAAA 


240 


CTAACGTTTG 


AAATATACTA 


CAGGAGTGAC 


ACGTAATGAC 


TCAAATTACT GAAAAAGAAT 


300 


TAAAAAAGAA 


GTATTTAGAT 


TTACTATCCC 


AAAATTTTGA 


TACTCCAGAA AAACTTGCAA 


360 


CTGAAATTAT 


CAATTT AGAA 


TCAATTTTAG 


AATTACCTAA 


AGGTACGGAA CATTTCGTCA 


420 


GCGATTTACA 


TGGTGAATAT 


GAAGCTTTCC 


AACACGTATT 


ACGCAACGGT TCTGGGAACG 


480 


TGCGAGCGAA 


AATCAATGAT 


ATTTTCAAAG 


AGAGACTTTC 


AACTAAGGAG CTTAATGACT 


54 0 


TAACTGCTCT 


TGTCTACTAT 


CCAGAAGrCra 


AATTtAAAAT TgATTAAAAG TGATTTCCAA 


600 


AATTgCGGtC 


mACtTAATGt 


CyGGtATATC 


ACaACmATCG 


aACATTTAAT TGAGTTAATT 


660 



25 AAATATTGT 669 

(2) INFORMATION FOR SEQ ID NO: 389: 

Mi) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1249 base pairs 
30 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

35 Ui) SEQUENCE DESCRIPTION; SEQ ID NO: 389: 

CACATGGCTG TTAGAGATAT GAATGGCCAT GCGTTACCTT TAACAAAAGA TGGCAATTTT 60 

TATCAAACGA ATGTAGATGC AAATGGTGTT AATCATGGTG GTAGTGAAAT GGTGCAAAAT 120 

40 

AAAACAGGTC ATATGAGTCA ACAArGCCAT ATGAATCAGA . ACACACATGA ACCAACAGCC 180 

ACACATGCAA CAAGGTCATA TGCAATCATC AAACCATCAA ATGATGAGTC CAAAAGCAAA 240 

TATGCATTCA TCAAATCATC AAATGAACCA AAGTAACAAA AAAGTTTTAC CAGCTGCTGG 300 

45 

TGAAAGTATG ACATCAAGTA TTCTTACTGC AAGTATTGCC GCACTACTAT TAGTATCTGG 360 

GTTATTCTTA GCATTTAGAC GACGTTCAAC AAATAAATAA ACATAATACG ATTAATAATA 420 

50 GAAAAATCGT GTGATTATCT GaGGGAGCCT AGGACATAAA TCAATGTCCT AGGCtCnCTA 480 

AtGTTATATT GGCAGTAGTT GACTGAATGA AATTGCGCTT GTAACAAGCT TTTCCATTTC 540 

55 
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CGATTGTCTT ATACGTGTCA GTGTTAATTC AGATATTTCC TGTGGAATAT ACCACTTATT 660 

AATCATAATT GGATAAGGTG tTTGTGCGTA CAGTGTTTCA ATAATCAGCC AACAATGTGT 720 

5 ATCACCaTCA AACACGTGAC TATGATTTTk GAAGTGGGGC GCTTTGGTAA TAGACATTTT 780 

TAAATCTGAT TGATATGCAT TGCTATAAAT CGTTTGCTCA ACGAATGTCT TCATGTCGTC 840 

TTCGTTTTGT GTATTCACTT TAAATGTGTC AATGACATTT AACGGTATAA AGGTAAAGCA 900 

70 

AAATGCATCA GCTTGCTTAG AATGATTGTC CTTTTTTTGA TAATAGCGTT CCATTGCAAT 960 

GACGGCAGAA GGATGGTTTG CAAACAAATG ATTTGTATAT TCACTTTCTA AATCAACACG 1020 

ATAATTAATT GATGACATAG ATACGCGAGC TAGCAATATT TGATCAAGTG GATGCTTAAA 1080 

15 

TTGATCCATA CTTGAAGCGT GTTGGGCATT TGTTTGTGGA ATAACAAAGT GTCCCTTCCC 1140 

TCTTGTACTC TCTACGATGC CATCTTCGGC TAACAATTTt ATAGCTTGGC GCAAAGTCAT 1200 

20 ACGACTGGAC ATCAAAGCGC GCACAAAGTT CCTTTTCAGT AGGTAATGC 12.49 

(2) INFORMATION FOR SEQ ID NO: 3 90: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1788 base pairs 
25 (B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY : linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 390: 



35 



40 



45 



AATGATGATT 


CATTCAAAGA 


AATTAACGCT 


CGGTATATGC 


TTGGTATTAC 


TCATTATATT 


60 


GATTGTAGGT 


TATGTCATTA 


TGACAAAAAC 


AAATGGTCGA 


AACGCCCAAA 


TTAAAGACAC 


120 


ATTTAATCAA 


ACATTAAAAT 


TATATCCAAC 


CAAAAATCTC 


GATGATTTTT 


ACGATAAAGA 


180 


AGGCTTTCGA 


GATCAAGAAT 


TTAAAAAGGG 


TGATAAAGGT 


ACTTGGATAG 


TTAATTCTGA 


24 0 


AATGGTAATC 


GAGCCAAAAG 


GTAAGGATAT 


GGAAACGAGA 


GGAATGGTGC 


TCTATATCAA 


300 


TCGCAATACT 


AGAACCACAA 


AAGGGTATTA 


TTTTATAAGT 


GAAATGACAG 


ATGACAGTAA 


360 


CGGCAGACCA 


AAGGATGATG 


AAAAAAGGTA 


TCCGGtAAAA 


ATGGAACATA 


ATAAAATCAT 


420 


ACCAACGAAG 


CCACTACCGA 


ATGACAAGTT 


AAAAAAAGAG 


ATTGAAAACT 


TTAAGTTCTT 


480 


TGTACAATAT 


GGCAACTTTA 


AAGATATTAA 


TGATTATAAA 


GATGGTGATA 


TTTCATATAA 


540 


TCCTAATGTA 


CCAAGTTATT 


CGGCAAAATA 


TCAATTGAAT 


AATGATGATT 


ATAATGTCCA 


600 


ACAGTTaAGa 


AAAAGATATG 


ATATTCCAAC 


CAAACAAGCG 


CCGAAACTAT 


TATTGAAAGG 


660 


CGATGGAGAT 


TTAAAAGGTT 


CATCCGTAGT 


TcTAGAAGTC 


TTGAATTTAC 


CTTTGTCGAA 


720 
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AGGTATGAGT CAAACTGAAT ATCAAATAAA ACCTGGTAAT ATAACAAGTA ACTCTGAAGA 840 

AACAAGTTCG ATATCTAAAG TGAGCTGTGA AATATAGGTA GCCATTTCAA AAAATTTAAA 900 

5 GGTGAATTTG ATAATGTAGC TCAAGGAGAT TGGGTTAAAA AGGCGAAGAA TGAACTGGAT 960 

GATATTAGTA AGAAATTAAA AAATATTCAA AGAACGGAAG TTTAATAGCT TATATGATTC 1020 

TTGGAGCTAA GACAGCATGC GTTCATTCAT GCCATTATTA ATATAAGCAC CGCAACAAAA 10 BO 

10 

AAGCTTCTAA TGTGATACAG GAACCTCATA TTCCGTATCA TGTTAGAAGC TTTTAATGTC 1140 

TAAAGAACAT CTACATTTTA TCATATTTTC TGACTTATTA AACTTTTATA TAATTAAATA 1200 

TTTCTTAATT TTCCAAAATA GTGATAAATT TGTGAAATAC ATCACAAATC CCTTTATTTA 1260 

15 

TTTGGAAATT CATGTAATAT TAGACTTGTA AGAAGTTAAT AAATAGAGAG AGACGAGAGA 1320 

GTTTATATAA ATACTATATA AACATTGGAG TGATGATTAT GAGAAAAGAG ATTGAAGCGC 1380 

2Q TTATTTTCTC AGACGT AA t A GCTATGATAT TTACGTGAAC ACTGGTGTAA ATCAAGGATT 1440 

AATTGGTGAC ATCAAAGATG GTTACCTAAC TATTGATTCT ATGCCTTACA TTGATGCTGA 1500 

GCGTTTGTAT CACTTTGCTA TGGAACGTAA ATCGTTAGTC ACTAACTAGT TCTTATTGCC 1560 

25 AATGATTACT ACCCCTAGTC GGCGGCAATT GAAGTGTGAT TGATGTAACT TGCCCTCGTT 162 0 

GGTGAGCAAT TGAGGGCAGA CCCCTTTAAT TAAGTAAACC CTAACTCCCC ACAAATCTGG 168 0 

AACGATACTA AAAGCCACGT CCTATATTGG ATGTGGCTTT AGTCAkACTT ATATTATTTT 174 0 

30 tAAAACGATT ACCTACAAGA TTTACATATA AAATTCTATC ATGnCTGC 1788 

(2) INFORMATION FOR SEQ ID NO: 391: 

(i) SEQUENCE CHARACTERISTICS: 
35 (A) LENGTH: 2407 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
■(D) TOPOLOGY: linear 

/ 

40 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 391: 

GCAAGTTTAG TTAAACAGAT ATTAAAACCA GATCAATATA CAGATGCAAA TTCTCTATTA 60 

^ GAGATTAGTT TGCAAACAGG TATGTTTATT GCAGGTGGAT TATCAGGAAT ATTATATAAA 120 

ATAAATGGAT TCACTCTAAT TATAGCGATG ACTATAATGA TGTTTCTAAT CAGCATTTTT 180 

ATGTTATTTA GATTGCATGT AGATAAACCA ACTCATTCAG AGGAAGAATC AACAAATAGC 24 0 

50 TTATTGCAAG AATATTTATT AGGATGGAAA TTTTTAAAAG ACAACATGAT GATATTTATT 300 

TTTGGAGTTA TTTCAATCAT ACCAATGGTG TTTACAATGA TCTTTAACAT ATCATTACCA 360 

55 
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TATGGCATTG GAGGATTATG TGCAGGTTTA 
ACTAAAGTAT TGATATTTTT GTTATATTTC 
5 TGGATAAACT CAGCATTTTA CTTATTCATA 

TCAATCAGAA TTTATATGAA TACAGCTATA 
CGCTCATTTA CGATATGGAC GTCAATTTCA 

10 

TTAGGAAGAT GGATTAATGA AATTAATGAT 
TCCTTACTCA TATTTGTaCA CTGCTGCTTG 
ATAAAGAAGA GTGACCGTCA CTCTTCTTTA 

15 

CTCTCTGCAC CCACACTTCA CTACTTCACT 
AATCAGTGAG ATTTGTTGCT TCGGTAAAGT 

2Q GATATGGCGA AACTAATGTA TTATCTTGCA 

CCAATAATCT ATTATCATAC AAACCACCTA 
CTCCCATCAT CTTTCTTGTC TTAACCGCGT 

25 GTACATCTTT CTTAGTCGCC ATTGTAATCG 

TATTAATGAT TCATTTCGTG TTGCTCTTAA 
TCAAACCTAT GGAAAAGAAA ATAATGATAA 

30 AGTTTGGAAG GTATGCGAAT AGCAGAAAAA 

CTAAACTTTT TAAAGAATGC TTTAAACCTT 
GTTATAAGAT AACTAAAAAA TCGCTTTACT 

35 

TATTCATAAG TAGTGTATCA TTAATAATGA 
TATTGATCAA CTTACCACAA CATTTATTTT 
TTGCATCTAT TGAAATTCCT TTTGTATAAG 

40 

AAAAAATCGA GATACTAATT ATAAAGAGGG 
AGTGAATTAC CACGTCCATT TTTTATTTTG 

45 TTTCGACACG TTGTAAGTGA AGCAGCTAGA 

ACTGAAAGCT TTTGCCACCC TGAAGGCATA 
GAAGATGAAC AGCCGATGGT CGCTCATATA 

SO ACGAGTATTC AATTAGCTAA AATGGGCTTT 

GTAGCAAATG TTGCTAAAAA GGGTAAGGGT 

55 



ATTTCAGCTA TTCTTTCGAA GAAAATCTCA 480 

ATATTAGTCA TAAATTCAGC ACTATTTATT 54 0 

GGATCATTTA TACTAGGCTA CTCAATTTCA 600 

ATGAACACTG TTTCAGATAA ATATGTCGGT 660 

TTGTTACTGC AAAGTTTAAT TGCTCCATnT 720 

AAATTCGGTT TCTATATTAT ACTCATTTTA 780 

TTAACAAAAC AGACAAAATA AAATATGCAC 840 

ACAAGCGACC ATTTATCGaT GGGCTTAGTT 900 

TTTTCAAATC ATTTTTTATG GTCTTAAATA 960 

CTAGAATTAA TATCATTTCT TTAGAACCTG 1020 

ATTTCTGCTG GGCACTTTTA GTCGCCTTGA 1080 

TAACCACGCC ATCATAATAA ATAATATATT 1140 

TTGAATTCAC ATGATTTAAA AATAAATCAT 1200 

CTCCTTCAGT TTTATGTTTA ATCACATTCG 1260 

TTTTATCTAT AATTATATGC GTAGTTAAAA 1320 

CAATGTTAAG AAATATAGTT ATAAAATTAT 1380 

TAGGTATCGC AAAAAATAAA TCCCACCAAC 1440 

CCATAATATC ACCTTTATAA ATTTGTCTTT 1500 

GTAAAAGTAG CCAAAGAAAA TTCTGAATCA 1560 

ACAATTTAAT ACTATAATCC TTGATCTTTG 1620 

AGACTACTCT TAGACTTCCC TTTCAAATGG 1680 

TTAGGCTTTT GTGGTAATAT CATCATGCAT 1740 

TATAAATATA TTATGAAAGA AAATTTTTGG 1800 

GCGCCAATGG AAGACGTTAC AGATATCGTC 1860 

CCGGATGTGT TTTTCACTGA ATTTACAAAT 1920 

CATAGTGTGC GCGGACGCTT AACTTTTAGT 1980 

TGGGGAGATA AGCCAGAACA GTTCCGTGAA 204 0 

AAAGGCATAG ACTTAAATAT GGGATGTCCT 2100 

TCCGGCTTAA TCTTAAGACC TGACGTTGCT 2160 
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GGCTACTATG AAATCGATGA ATGGAAAGAT TGGTTGAAGC ACGTCTTCGA ACAAGACATT 2280 

GCCAATTTAT CTATTCATCT TCGTACACGT AAAGAAATGA GTAAAGTAGA TGCACATTGG 234 0 

GAATTAATCG AAGCTATTAA AAATTTACGT GACGAAATTG CACCAAATAC ATTGTTAACA 2400 

ATTAACG . 2407 



(2) INFORMATION FOR SEQ ID NO: 392: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2424 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 3 92: 

2Q ATGATGnATG GCnCCGCCAA GAAGTTGAAC CAGTCTATTG GCTAGAATTG CTCAAAAAGC 60 

GAGAcaTGTG GTATTCaTAT GTTaGTAgCt ACGCAAAGAC CATCTGTCAA TGTAATTACA 120 

GGTTTAATTA AAGCCAACAT ACCAACAAGA ATTGCATTTA TGGTATCATC aAGTGTAGAT 180 

25 TCGAGAACGA TATTAGACAG TGGTGGAGCA GAACGCTTGT TAGGATATGG CGATATGTTA 24 0 

TATCTTGGTA GCGGTATGAA TAAACCGATT AGAGTTCAAG GTACATTTGT TTCTGATGAC 300 

GAAATTGATG ATGTTGTTGA TTTTATCAAA CAACAAAGAG AACCGGACTA TCTATTTGAA 360 

30 GAAAAAGAAT TGTTGAAAAA AACACAAACA CAATCACAAG ATGaATTATT TGATGaTGTT 420 

TGTGCATTTA TGGTTAATGA AGGACATATT TCAACATCAT TAATCCAAAG ACATTTCCAA 4 80 

ATTGGCTATA ATAGAGCAGC AAGAATTATC GATCAATTAG AGCAACTCGG TTATGTTTCG 540 

35 

AGTGCTAATG GTTCAAAACC AAGGGATGTT TATGTTACGG AAGCAGATTT AAATAAAGAA 600 

TAATTATGAG TAAGGAGTTT TATATAATGA CACACTATCA TTTTGTCGGA ATTAAAGGTT 660 

CTGGCATGAG TTCATTAGCA CAAATCATGC ATGATTTAGG ACATGAAGTT CAAGGATCGG 720 

40 

ATATTGAGAA CTACGTATTT ACAGAAGTTG CTCTTAGAAA TAAGGGGATA AAAATATTAC 780 

CATTTGATGC TAATAACATA AAAGAAGATA TGGTAGTtAT ACAAGGTAAT GCATTCGCGA 84 0 

45 GTAGCCaTGA AGAAAtAGTA CGTGCACATC AATTGaAATT AGATGTTGTA AGTTATAATG 900 

ATTTTTTAGG ACAGATTATT GATCAATATA CTTCAGTAGC TGTAACTGGT GCACATGGTA 960 

AAACTTCTAC AACAGGTTTA TTATCACATG TTATGAATGG TGATAAAAAG ACTTCATTTT 1020 

SO TAATTGGTGA TGGCACAGGT ATGGGATTGC CTGAAAGTGA TTATTTCGCT TTTGAGGCAT 1080 

GTGAATATAG ACGTCACTTT TTAAGTTATA AACCTGATTA CGCAATTATG ACAAATATTG 114 0 

55 
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TGGCACATAA TGTTAAAAAA GGTATTATTG CTTGGGGTGA TGATGAACAT CTACGTAAAA 1260 

TTGAAGCAGA TGTTCCAATT TATTATTATG GATTTAAAGA TTCGGATGAC ATTTATGCTC 1320 

5 AAAATATTCA AATTACGGAT AAAGGTACTG CTTTTGATGT GTATGTGGAT GGTGAGTTTT 1380 

ATGATCACTT CCTGTCTCCA CAATATGGTG ACCATACAGT TTTAAATGCA TTAGCTGTAA 1440 

TTGCGATTAG TTATTTAGAG AAGCTAGATG TTACAAATAT TAAAGAAGCA TTAGAAACGT 1500 

10 

TTGGTGGTGT TAAACGTCGT TTCAATGAAA CTACAATTGC AAATCAAGTT ATTGTAGATG 1560 

ATTATGCACA CCATCCAAGA GAAATTAGTG CTACAATTGA AACAGCACGA AAGAAATATC 1620 

CACATAAAGA AGTTGTTGCA GTATTTCAAC CACACACTTT CTCTAGAACA CAGGCATTTT 1680 

15 

TAAATGAATT TGCAGAAAGT TTAAGTAAAG CAGATCGTGT ATTCTTATGT GAAATTTTTG 1740 

GATCAATTAG AGAAAATACT GGCGCATTAA CGATACAAGA TTTAATTGAT AAAATTGAAG 1800 

20 GTGCATCGTT AATTAATGAA GATTCTATTA ATGTATTAGA ACAATTTGAT AATGCTGTTA 1860 

TTTTATTTAT GGGTGCAGGT GATATTCAAA AATTACAAAA TGCATATTTA GATAAATTAG 1920 

GCATGAAAAA TGCGTTTTAA TATGTTTATA ATAGAGTAGT ATGGGTATTT ATTATTAATG 1980 

25 ACATTATTAC ATGTTAATTA GGAGGCGTTT TTAATGGATT GGATTTTACC AATTGCTGGA 2040 

ATTATCGCTG CGATTGCATT CTTAATTTTA TGTATCGGTA TCGTAGCTGT ATTAAATTCT 2100 

GTTAAGaAAA ACTTAGATTA TGTTGCAAAA ACACTTGACG GTGTAGAAGG TCAAGTTCAA 2160 

30 

GGTATTACTC GTGAAACAAC AGATTTACTT CATAAAGTAA ACCGTTTAAC TGAGGATATC 2220 

CAAGGTAAAG TAGATCGTTT AAACTCAGTT GTAGATGCTG TTAAAGGTAT CGGTGACTCA 2280 

GTACAAACGT TAAACAGCTC TGTAGATCGT GTAACAAATT CAATTACACA TAATATTTCT 234 0 

35 

CAAAATGAAG ATAAAATCTC ACAAGTTGTT CAATGGTCAA ATGTTGCAAT GGAAATTGCA 2400 
GACAAATGGC AAAATAGACA CTAC 2424 
(2) INFORMATION FOR SEQ ID NO: 393: 

40 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 738 base pairs 
(BJ TYPE: nucleic acid 
(C) STRANDEDNESS : double 
45 (D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 393: 
50 CnATAATATT CnTCAAnCCT TTAAATAGAG GAATAGACTG CCGACAGAGT CCGAGACTTT 60 

GTGGGTAGTT TTTTTAGTTT TGATAACGGA AGTTAGAGGC TCTCTGTCAA ATTGGGCAGA 120 
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AGTGTAAAGT TTTCAACATA ATACTATTAG TTCGGTCATG TATCGGACTG ATGGAAAAGC 240 

GTTTCACTTT TAATGACTCA TTAAGAACGG CCTGAAAATG TTTGGCGTAT TAAGTGCAAT 300 

5 

GATAGTTTTG ACATTTAGTT TCTAATTGGT CATTACTGCC GAGCAAATCT AGTAGAGTAA 360 

TCATGTAAAT CTTTAATGTG CCATTTGATT CACTAGCGGT GTTAATAACT ACGGAAATTG 420 

CATTTCCGAC TGAAATTTTT GAAAAATATC AACGTACGCT ACAAATAAAA TTTTAAACTG 480 

10 

TTATAAATGT GTCTCAATTT CATATGTTCA TCGACGATAT GAAGCGTATT ATGGTAAAAT 540 

GAAGAAATAA TAAACTTGTT AATAAATAAA ACATCACGAT TTGACTAAAG CACTTTATTA 600 

1S TTGTGTAGAT AATAGTTTTT TAACGAAATA AAAATGGCGA CTGGTTTTAA TAAATCAGCT 660 

AATGAATCAC TACACCTATA AGTATGAATA TAGTGATTAG AATGCTTTGT ATAGTTGGAT 720 

TTTGCAAAAT TGATGTTA 73 8 

20 (2) INFORMATION FOR SEQ ID NO: 394: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1270 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
25 (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 394: 



30 


AAAAGTTGTA 


ATTAAAAGTG 


GGATTTTACT 


TAAGnnAGAA 


GGAAACTATT 


TATATGACTA 


60 




ATAAAAGAGn 


AGATGTCCGC 


AATATAGCAA 


TTATTGCTCA 


CGTTGACCAT 


GGTAAAACAA 


120 


35 


CTTTAGTAGA 


TGAGTTGTTA 


AAACAATCTG 


GTATATTCAG 


AGAAAATGAA 


CATGTCGATG 


180 


. AACGTGCAAT 


GGACTCTAAC 


GATATCGAAA 


GAGAGCGTGG 


AATTACGATT 


CTAGCCAAAA 


240 




ATACGGCTGT 


TGATTATAAA 


GGTACACGTA 


TTAATATTTT 


GGATACACCA 


GGACATGCAG 


300 


40 


ACTTTGGTGG 


AGAAGTAGAA 


CGTATTATGA 


AAATGGTTGA 


TGGGGTTGTC 


TTAGTAGTAG 


360 




ATGCGTATGA 


AGGTACAATG 


CCTCAAACAC 


GTTTTGTACT 


TAAAAAAGCG 


CTAGAACAAA 


420 




ACCTGAAACC 


TGTTGTTGTT 


GTTAATAAAA 


TTGATAAACC 


ATCAGCACGT 


CCAGAGGGTG 


480 


45 


TTGTAGATGA 


AGTTTTAGAT 


TTATTTATTG 


AATTAGAAGC 


AAACGnTGAA 


CAATTAGAAT 


. 540 




TCCCTGTTGT 


TTATGCTTCA 


GCAGTAAATG 


GTACAGCTAG 


CTTAGATCCT 


GAAAAGCAAG 


600 




ATGATAATTT 


ACAATCATTA 


TATGAAACAA 


TTATTGATTC 


ATGTACCAGC 


TCCAATTGAT 


660 


50 


AACAGTGATG 


AGCCCATTAC 


AATTTCCAAG 


TAGCATTGTT 


GGACTACAAT 


GATTATGTTG 


720 




GACGTATTGG 


TATTGGTCGT 


GTATTCAGAG 


GTAAAATGCG 


TGTCGGAGAT 


AATGTATCAC 


780 
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GATTAAAACG TTTAGAAATT GAAGAAGCAC AAGCTGGAGA TTTAATTGCT GTTTCAGGTA 900 

TGGAAGACAT TAATGTTGGT GAAaCTGTAA CACCACATGA CCATCAAGAA GCATTGCCAG 960 

5 TTCTACGTAT TGATGAGCCT ACTCTTGAAA TGACATTTAA AGTTAACAAT TCTCCATTTG 1020 

CTGGCCGTGA AGGTGACTTT GTAACAGCAC GTCAAATTCA AGAACGTTTA AATCAACAAT 1080 

TAGAAACAGA TGTATCTTTG AAAGTTTCTA ACACAGATTC TCCAGATACA TGGGTAGTTG 1140 

10 

CTGGTCGCGG TGAATTGCAT TTATCAATCC TTATTGAAAA TATGCGTCGT GAAGGTTATG 1200 

AATTACAAGT TTCAAAACCA CAAGTAATTA TTAAAGAAAT AGATGGTGTA ATGTGTGAAC 1260 

CATTTGAACG 1270 

75 

(2) INFORMATION FOR SEQ ID NO: 395: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1365 base pairs 
20 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

25 ' (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 395: 



30 



35 



40 



45 



AAGACCAGGA 


GAACAmGTAA 


AACAATATAC 


AGTTGaAATC 


GCTCGTAAAT 


TAATGGAATT 


60 


TGATATAAAA 


TGCTCGTGAT 


TGCTTGTAAA 


TACGCAACTG 


CTGTnGCTTT 


AGAATATTTA 


120 


CAAAAGACCT 


TATCAATCCC 


CAGTGATTGG 


CGTAATTGAc 


CAGGTGCTAG 


AaCAGCAATA 


180 


ATGACTACTA 


GAAATCAAAA 


TGTATTAGTA 


CTAGGAACGG 


AAGGCACAAT 


TAAATCTGAA 


240 


GCATATCGTA 


CGCATATTAA 


ACGTATCAAT 


CCACATGTAG 


AGGTACATGg 


CGTTGCCTGT 


300 


CCAGGTTTTG 


TGCCACTTGT 


AGAACAAATG 


AGATATAGTG 


ATCCAACAAT 


TACAAGCATT 


360 


GTCATTCATC 


AAACACTGAA 


ACGTTGGCGT 


AATAGTGAGT 


CTGATACTGT 


CATTTTAGGA 


420 


TGTACCCACT 


ATCCATTGCT 


CTATAAACCT 


ATCTATGATT 


ATTTTGGTGG 


TAAAAAGACA 


480 


GTGATTTCGT 


CTGGATTAGA 


AACGGCTCGT 


GAAGTTAGTG 


CATTGCTAAC 


ATTTAGTAAT 


54 0 


GAACATGCAA 


GTTATACTGA 


ACATCCAGAT 


CATCGATTTT 


TTGCAACAGG 


TGATCCTACT 


600 


CACATTACTA 


ACATTATCAA 


AGAGTGGTTA 


AATTTATCTG 


TCAATGTGGA 


ACGTATATCA 


660 


GTGAATGACT 


AGGAGGATTT 


TTAATGAAAG 


AGATTGTTAT 


TGCATCGAAT 


AATCAAGGGA 


720 


AAATAAATGA 


CTTTAAAGTA 


ATATTTCCAG 


ATTACCACGT 


AATAGGTATT 


TCAGAACTAA 


780 


TACCAGATTT 


TGATGTGGAA 


GAAACAGGAT 


CAACATTTGA 


AGAAAATGCT 


ATATTAAAAT 


840 


CAGAAGCTGC 


TGCAAAAGCA 


TTGAATAAAA 


CGGTCATAGC 


TGATGACAGT 


GGACTAGAAG 


900 
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GCGATGAAGC AAATATTGAA AAATTATTAA ATAAGCTTGG TAATACAACT GATCGTCGTG 1020 

CGCAATTtGT TTGTGTCATA AGTATGAGTG GCCCTGATAT GGAAACAAAA GTATTTAAAG 1080 

GTACTGTTTC AGGTGAAATT GCAGATGGAA AATATGGCGA AAATGGTTTC GGATATGATC 1140 

CGATATTTTA TGTACCGAAA TTAGATAAAA CCATGGCTCA ACTTTCAAAA GAACAAAAAG 1200 

GGCAAATTAG TCATAGACGA AATGCGATTA ATTTACTTCA AGCTTTTCTT GAAGGTGATA 1260 

AAAATGTCTA AATGGATTAT TGTGAGTGAT AACCATACTG AATCAGGCGT TTTATATCAA 1320 

ATTTATGAAA TGCACCCAGA TGCAGATGTA TATTTACATT TAGGA 1365 
(2) INFORMATION FOR SEQ ID NO: 396: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1383 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 396: 

AATTCCTGGT GCAATAATAA ATAGGATGAA AAAGATTCGG AAAATATGAT AACTCGTAAT 60 

CATAGCAACA TCGGCACCAG TAGCTAATGC AACTAAAACT ATCTGATTAA CCCCTCCTGG 120 

TGCTGCACCA AGaAACAATT CATTAATAGG ATTATTATCA AAGAAATGTA TGATATAAAC 180 

30 CATGATTAGC GCACCAATTA TCAACATAAT ATTTTGAATT GTAATTGCGA TTGCTAGTCT 240 

ACCTTTTAAA TCTGACAATA AATGCGCAAT TTGAACTCCA ATTCTAATCA TATATATTAG 300 

TTGTGCCATG TTCAACAACC AATGATCTAG TGTAAATGTT AAACCTGTAG AAAAATTCCA 360 

55 AACAATTAAT ACAATGAGTG GTGCTAATAA TTGAAATGTT GGAAACTTTA TTTTAGACAT 420 

AATTAGATAA ACTATAAAGA TAGCTATCGC TAAAATAACT ATTTGCCCTA TGTTTAATAC 480 

TTGTGATAAA GGCAAGACTT TTGTTAACTT TCCATTCGCA TGCATGTTAC CATCATGAAA 540 

AAAATATGAA ATGAACGGTA CTAAAACAAC AACAAATATA ATTCGTGATG TTTGCGTTAA 600 

GCTAACAACT AACAAATTAG CACGTTTGTC TTGTTCAGCC ATGACCAGCA TTTGTGTTAG 660 

TGCTCCTGGT ATAACACTTA AAATAGCTGT TTCTGTATTA ATACGTGCAA TTTTTTTAAA 720 

AACAAATGCC ATTACTATTG CAATTAATAA TATCGAAATA GATACAACAA TAATCGAAAG 780 

CCAATTGTTT TTAATATCCA TAACGACATT TTTCGTAAAC GTTGATCCGA TTTGCACACC 84 0 

TAATAGTACA ATACCTAATT CACTAAGTAA GAATGGCCAT TTAATATCAA GTTTGAAAAC 900 

TTTTACACAA ATGATTGATG CGATAATAGG ACCAAACATA AATGGAAGTA ATACGTGCGA 960 
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TATCATTGCC ATGTTTTCCA CTTCTTTCAA TAAAAAATAA AATGACTAAA TTGCTGCTTG 1080 

AGCTTCACGT TTGTTAAGAT AACAATATCC GCTAGCAGTT tTGACTACAA AGCATATATG 1140 

GaCTTTCACT ATCAAGTCGC CGCCCATGCC TTATATACAT TTAAAAnGAG CCTGAACAAA 1200 

GTTCAGGCTC TCAATTTGTC CGTATATTTA TTTTACAATA CGACTTAAAG CCGTATCAAA 1260 

TGCTTGAATC GTTTTTCAAT ATCTTCTTTC GTGTGTGCCG TAGATAAGAA TGTACCTTCA 1320 

AATTGAGATG GnGGnAAAAA CACACCTCTT TGnCATTCTC GGTACATTTC TGCAATAATT 1380 

TCC 1383 
(2) INFORMATION FOR SEQ ID NO: 397: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 415 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY : linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 3 97: 

25 TCCACTAAnA TGATTACAAT TGCATTAGTT TGGTGGAGTG CATTTACAAT CTTAACGGGT 60 

ATGATTAAGA ACCACGGTTT AATTaTTTAG TGAGATTCTT ATTTGGTGTA GGTGAGGCGC 120 

CAATGTACCC TTCTAATGCT GTGTTTAATT CATTTTGGTT CTCTAAAAAT GAAAAAGGTA 180 

30 GAGCATCAAG TGCATTATTA GCAGGATCAT ATTTCGGACC TGTATTAGCA CCAATAGTTA 240 

CAATTGCTAT TGTTAACGCA TTTAACTGGC AAGCAGTATT TTACATTTTT GGTGCAGTAG 300 

GTATTTTAAT GGCJtGTATtA TGGGCGATTA TTGCCAAAGA CTTACCTGaG CrACATAGwa 360 

35 TGGTTAATGA AGCGGAGAAA CGTTTCATTA TGGAAAATCG TGATATCGTA GCTAC 415 



(2) INFORMATION FOR SEQ ID NO: 398: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1141 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS: double 
(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 398: 

TTTTAGaTaA aTyCAATTnT CyATaCTaAA TgATTnTCTT ATTaCGTCAA TTcGCCTTTT 60 

aTTTTATCGT AATCTTTCCa CTGCAAAGCT AAAGCTTCTC CTATTCTAAG ACCAGAATAA 120 

AATAACAGTC TAGTTAGCTG ACGAGAAGTA TCATTTGTGA TTTGTTCTAC TTTTTCATCA 180 



1292 



EP 0 786 519 A2 



AATGTGGGGT CGTATAAGAG CTTGTAATGC TTTTTGGCGT AATTGATAAC TGCTTTAAAA 300 

CCTGCCCACA CAGATCGTGC ATAGTCAACA GAAAGACCTG CATCGTTTAA CAAATAATTC 360 

CTGAAAGCAG TACATTGCGT AGTAGTGATT TTGCCAATAG GGATATTTCC GAACCTTTCT 420 

TTTATGTGAG TATTATATTC TGTAGTTCGC TTTTCTATTG AGCGTGCAGA AAGATTTTCA 480 

TTTTTTAAAC GATCAAAAAA TATATATTCA AAGGGTTGAT TGTCCGAGTA TCCATATTTA 540 

ACATTTTGTA TAAATTCGCT TTCAGCTAGT TTGGCATCTT TCTTACGTTC AAACCCACGC 600 

TTCATTTTTC GTTTGTTATT ACCGTATACA TCTTTATATC TAATGGAAAA ATACCATTTA 660 

CCTGTATTAT CATCCTTATA TACTGGCATT TTGCTTCTCC CTCCTCAAAA TTGGCAAAAA 720 

ATAATAAGGG TAGGCGGGCT ACCCGAAATT TAGTACTAGG TACTAAATGT GATATAATAA 780 

AATAAAAAGT AGGTGATGTT ATGACATTTA AAAACAATCA TAATTTCAAT GAATTAGTTT 840 

TAACGAATGA AGACATTAGA ATTTTAAAAA ATGTCTTAGA AGATGCAGTC AGTGTTTATG 900 

ATGAATATTC GGTATGTAAT GAAGAATCCG ATTTTGCTTA CTGTTTATTA AGAGACTTAT 960 

ATACATTAGA CAGCTTAGCT ATTTCGTCAA ATAATGTTTG AATTATCGAA TTGTACTCTT 1020 

25 CGATTTTAAT ACCATGCATA ATAGAGTTTC TGTGTTCAAT AGCAGCTTTG ACTGAATGTk 10 BO 

TTAAAIJ3TTC TTCTATTAAA TCGTTGTTTk CCAtTTCGtJc TAaAAATGTt CyTATATTCC 1140 

T 1141 
30 (2) INFORMATION FOR SEQ ID NO: 399: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 706 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
35 (D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 399: 

ACTGTGGTAG GTTTTTTATT TTGAAGTATT AATCATAACA GACTAATAAT CATGAGGTAA 60 

CTAATAACAC ATATTTAACT TGTATTCTTA AACTGGTATA ATAAATTTAT GTTGAAATGA 120 

ATATTGTATG ACAGGGTATT CACTTTTATT AAAAGGTAAA ATTAAATAAA GGTTTTATAG 1B0 

AACGTATTTA AATATATGAG GAGTAAACAA ATGGCTGATA GAACGAATAA AGAAATTAAA 240 

ACAGGACGCT TTATTGCAAC TGCATCAATC GTATTCTCAA TATTATTGAT TATTCATTAC 300 

TTTGTTTCGT TGGATAATGC GACTGCCAAA GCATTACTTA ATTTAACGAA TCAAAACACT 360 

TCAGATAAAG CGATTGATTA CATTTTAAAC AGCTTTAGAT TCACTGGTAT TATGTATATT 420 



1293 



EP0 786 519 A2 



ATGTTTGCAG TTTATGTATC AAATAGTTTG TTTACGTTGA TTAATTTATC AATCACAATT 540 

CAAGCAATAA AAGCTGCACA CGGTGCGTAC TTAACATTGC CAATTTTAAT TGTTATTATA 600 

GGTTCGGTTG CATTAGCGAT TTATATGCTT GTTGTTTCTA TCAAACGTAA AAGTACATTT 660 

AATCGCTAGA AAATTGATTT TAACAATAAA AATATGAAAA AAAAnn . 706 



(2) INFORMATION FOR SEQ ID NO: 400: 

10 

ii) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1187 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 400: 



30 



35 



SO 



ACACAATCTG 


AAGATTCACG 


TTGTGGTGCT 


GGACATGATC 


GAAAAATTAG 


AGCTGAACAA 


60 


ATGAnAGAAA 


TCAGTGATTT 


TGTTAAAAAG 


AAAAATATCC 


CTAAAGATGA 


AACGGTATAT 


120 


ATAGGTGGCG 


ACCTTAATGT 


CAATAAAGGC 


ACTCCAGAGT 


TCAAAGATAT 


GCTTAArAAC 


180 


TTGAATGTAA 


ATGATGTTCT 


ATATGCAGGT 


CATAATAGCA 


CATGGGACCC 


TCAATCAAAT 


240 


TCAATTGCGA 


AATATAATTA 


CCCTAATGGT 


AAACCAGAAC 


ATTTAGACTA 


TATATTTACA 


300 


GATAAAGATC 


ATAAACAACC 


AAAACAATTA 


GTCAATGAAG 


TTGTGACTGA 


AAAACCTAAG 


360 


CCATGGGATG 


TATATGCGTT 


CCCATATTAy 


aCGTTTACAA 


TGATTTTTCA 


GATCATTACC 


420 


CAATCAAAGC 


CTATAGTAAA 


TAGTGCTCAA 


CTAACTAATA 


ACTTGCTtCG 


TTCTAAAAGG 


480 


ACGAAGCGAG 


TTATATTGTT 


AAAATTTGAA 


TTGACTTACA 


TTTTAATAAA 


ATCATCTTAA 


540 


CAACTTTAAT 


TTTTCaTTAA 


TACAaGTCTT 


TACTCTACAC 


TCAAACnAGA 


TTCATACACT 


600 


GCACGTCATA 


ATAAATCTAT 


CTATTCAAAT 


ATAAATAAAA 


GTTACCTACT 


ACATTCTATG 


660 


TAGCAGGCAA 


CTTTTATTAC 


TTATTTCTTT 


TCATTATCAT 


TAAGTACTTT 


TACAAACTTC 


720 


ACATTATGTG 


TCTTCCAATC 


AACTTCATAT 


AATGCTGATA 


ATTTTTCTTC 


TTTTTTATCT 


780 


ACATGGTTTT 


CACCAGACCA 


ATAGCCCCAG 


AAACCATGGC 


GATTCCAATC 


TATTTTAAAC 


840 


TCATCCATTG 


ATCTTTTATA 


ATGAACAACA 


AATTGTGATT 


TACCTTTGTC 


TTTTTTATCA 


900 


TGTGACATAA 


CAGCTAAAAA 


TTCTGGATTA 


AACCCTTCAG 


ACACAGTTAC 


AGGCATTTTG 


960 


TCTTTAGGTG 


TGAAATTATC 


TTTCGCCCAT 


AAATTTCCAT 


TTCGTGTTAA 


AGAAAAAATT 


1020 


TCACTTTTAG 


TTCTATTATC 


ACTATCATTA 


GTTAATTGTC 


TCGTATGGTC 


ATGTCCCATA 


1080 


TTATTTATCA 


AATGTGCTTC 


TACTTTCCAA 


CCTACACCTT 


TATGTGACGT 


AGATTGATCA 


1140 
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(2) INFORMATION FOR SEQ ID NO: 401: 

(i) SEQUENCE CHARACTERISTICS: 
5 (A) LENGTH: 847 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

w 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 401: 





CCAGAATTAT 


TTTTTCAAAA 


AGGACAATTT 


AACAATGTCG 


ATAACGTTAT 


CATAAGCAAA 


60 


15 


CCGATGAAAG 


GGACAATGCC 


TAGAGGTAAA 


ACGGAaGCTG 


AAGATCAACA 


GTATTATAAA 


120 




ACATTGCAAA 


CTTCTTCGAA 


AGATCGTGCA 


GAAAATGTCA 


TGATTGTTGA 


TTTACTAAGA 


180 




AACGATATAG 


GGAGAATATC 


ACAGAGTGGC 


TCAATTAAGG 


TGTATAAACT 


ATTTTTTATT 


240 


20 


GAGGCATATA 


AAACTGTATT 


TCAAATGACT 


TCGATGGTAA 


GTGGAACTTT 


AAAAAATAAT 


300 




ACAGACTTAA 


CTCAAATTTT 


AACATCGTTA 


TTTCCTTGTG 


GTTCGATTAC 


AGGTGCACCG 


360 




AAACTGAATA 


CAATGAAATA 


TATTAAACAA 


TTAGAAAGTT 


CACCTCGTGG 


TATATACTGC 


420 


25 


GGACAATTGG 


ACTATTACTT 


CCAACTGAAG 


ATGATAAAAT 


GATTTTTAAT 


ATTCCGATTC 


480 




GCACTATTGA 


GTATAAATAT 


GGACAAGCGA 


TTTATGGAGT 


CGGAGCAGGT 


ATTACAATTG 


540 


30 


ATTCTAAGCC 


AAAAGATGAA 


GTGAATGAAT 


TTTACGCAAA 


AACCAAGATT 


TTGGAGATGT 


600 


TATAATGCAA 


TTATTTGAAA 


CAATGAAAAT 


TGATAATGGA 


CATATCCCTA 


GACTTACTTA 


660 




TCATACTAAT 


CGCATAAAAT 


GTTCTTCTGa 


GCGATTAAAC 


TTTAAATTTG 


ATGAACATGC 


720 


35 


ATGGCGAAAT 


GAATTAAACG 


ATGTAACAAC 


AAAGTATCAC AGTGGTCAAT ATAGACTTAA 


780 




AATCGTATTA 


AATGCTGAAA 


GCAAATTTGA 


AACGATAGTG 


TCACCTTTAC 


CTGAGAAAAG 


840 



TAGTTTT 847 
(2) INFORMATION FOR SEQ ID NO: 402: 

<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 740 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 402: 

50 

TGAAGATGAA GCAGAAGCAG AAGACAATCT GCTACGAGTA CAATCGAAGA AAGAAGAAGT 60 
GTATCGTCGA TTACTTGCTT CTAACTTAAC AAGCGTTCCT GAAAG t TTAT CATCATGAAA 120 

55 
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GTTAAACAGT TAAAAGATAA AGTGTCTAAA ATTGTGATTC AAATGAATAC ATTTGAAGAT 240 

GAAGCAAATG ATGTTCTTGT TAATGCTGTT TATGCAGAGA AATTAATTCA ATATGGAAAT 300 

AGATATCGTA AGGACTATAG CAATGTTGAT AAGAGCTTAA ATGAAGCTGA ACGATTATTT 360 

AAAAATAATC GCTATAAGCg TGCGATTGAA ATTGCAGAGC AAGCTCTTGA AAGTGTTGAG 420 

CCAGGTGTTA CTAAACATAT TGAAGAAGAA GTTATTAAGC AATAGAAACT AGTATGTAGT . 480 

TATACTTAAA TAATATGAGC ACTCTGTCAA ATTGGACTGA TGAGTTTAAT AATTGAAGTT 540 

AGCCAACGAT ACGTTGTCTA GCTTCTTTTT TATATGGATA AATGaAAGGG ACAATAAATA 600 

TAAATAGCAA TTGTTTAAAG ATAAACGTAA TCAAATGTGT TGTTTTAATT AATATAAGTA 660 

GTGAAAAAAG CATAATCACA CAGCTGTTTA AATAGAGTGA AATAGTCTAA TTCTTATTTA 720 

ATAAGTAGAA ATAAGATTAT 74 0 
20 (2) INFORMATION FOR SEQ ID NO: 403: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 630 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
25 (D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 403: 

ATGCCAATAA TTAAACCATG TAATAAATAT ACGTATAGCG TACGACTACC AATATAAGTA 60 

TATAATTTTT TCTTTGTTGA CATTAAATTT AGAAACGCAG TCATTGCGAT TAATATAATT .120 

CCATATAATA TAAGTCGTTT AAAAGGACTG AATATACTCT GTCCTTCATT TTCAAGTGAA 180 

GTATATGGTG AACTTCCCAA TAACCAATCT GCATTGATAG GATGAATCAC GTAAACGATA 240 

AAAAACAAAA TAAAGGTAAT GATAGATACT GGTATTAGTT TTTTATTTTT AAAAATAGCC 300 

40 GTATGTTTTT TGGTGAAAAT GTAACCTAGA TAAAATATTG GGAAAAATAC GATTGTCCTT 360 

GAAATGCTTA AGTAGCTATC GATGTTATCT GAAAAACCTG CTCCAATAGA TATAATAATT 420 

GAAACTGATA GCACTTTATA TGGATTAAAT CTTCTAACTA TTACTAAAAT GACATGAAAG 480 

AAAAATAGCG TGATCAAAAA CCATAACGCA AATACTGGGT TAAAAGGATC AAGTTGTAAT 540 

TCGTCACTTT TACCTGTTAA GAAATAATAA ATTGAAAAGA ATGCAAAAAA TATCATATAA 600 

GGTACTATCA AACGTTTTGA AATTTTTTCT 630 

(2) INFORMATION FOR SEQ ID NO: 404: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6254 base pairs 

55 



45 



SO 



1296 



EP0 786 519 A2 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 404: 
ATTTAAACGT TCAGTTTCTA AAAGTGGAAC AATCCAAGAA GTACGTAAAC GTGAATTTTA 
CGAAAAACCA AGCGTAAAAC GTAAAAAGAA ATCAGAAGCT GCACGTAAAC GTAAATTCAA 
ATAATTAATA CCTCTGTTGA CTCCCTCAAC ACGAATATTA ATTATATAAA ACAAACATCA 
CAAGTTAGTG TCTGACACTA ATATGTGATG TTTTTTTGTT GTCAATTTTT AATTAAAAAA 
AGTTATATAG TTTATAAATA ATCAAATTGA TATTCTATAG GTTCTTATAA CTATAAAGTA 
TATTCAATTT CATGTATAAT TAATGTGAGG GCGAGGTGAA ATTGTGAGTT ATAATAATTT 
TTTACAAATG ACAACTATCT TGGAATCAAC GGCTGGAGAT ACTTGGGTTG AACAAGTTAG 
CAATATAATT GTTCAACCTA TTTTTACGTT AATATTAACC TGTTTGACAT TCTTAGGATT 
TGTATATCAA CTTTACTCTA AAAAAATCAA TGCAGCTGGT ATTATCGCCA CATTATCATT 
ACTTATTTTA TTTTTGGGAT TTCTAATCCA AGGAAATGTC AATATGCATT CTATCTTAAT 
ATTCTCAATT GGCGTTATAT TAGTTGTAAT TGAATTATTT GTAGTTGGTG CAGTAATTGG 
TATTATTGGC ATGATACTGA TAACTATAAG CATAACAACG CTCGGTGATA ATTTGCTATT 
TATGCTTGCG AATGTTATCG TTGCCTTGAT TTTAACGATT GTAGAATGGG TGATATTAGT 
GAAGATTTTC AACAGAAAGA TTCCGTTTTT GGATAAAGTT ATCTTAAAAG ATTCAACTAA 
TTCTGAGTCA GGTTACAATT CTCATGATAA CCGCTCGCAC CTCGTAGGAA AGACTGCTCA 
AACAGTTACA GATCTTCGAC CTGCAGGGAT TATTTTTTGT GAAAATGAAC GTATTGATGC 
TGTTTCAGAT GGCAACTTTA TTTTGCGCAA TAAAACGGTA AAAATCCTTG AAGTTGAAGG 
AACAAGAGTA GTTGTGAGGG AAGTAGATTA ATTAAAAGGA GCGATACCAT GTTTAGTTTA 
AGTTTTATCG TAATAGCAGT TATTATAGTA GTTGCATTAC TTATTTTATT CTCATTTGTA 
CCCATTGGTT TATGGATTTC AGCGTTAgcA GCTGGCGTTC ATGTTGGTAT AGGTACATTG 
GTTGGTATGC GTTTACGTCG TGTATCTCCA AGAAAAGTTA TAGCGCCATT AATTAAAGCG 
CACAAAGCAG GACTAGCATT AACAACAAAC CAATTAGAAT CGCATTATCT AGCAGGAGGA 
AATGTTGACA GAGTTGTTGA CGCTAATATT GCTGCACAAC GTgcTGACAT TGATCTTCCT 
TTCGAACGTG CTGCTGCAAT TGaCCTTGCA GGACGTGACG TATTAGAAGC GGTTCAAATG 
TCTGTTAATC CTAAAGTCAT TGAAACACCA TTTATCGCAG GTGTAGCAAT GaACGGTATT 
GAAGTGAAAG CCAAAGCTCG TATCACAGTT AGAGCTAATA TTGCTCGACT TGTTGGTGGT 
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AGTAAGCATC ATACAGAAGT ACTTGAAAAC CCAGATAATA TTTCTAAAAC AGTTTTAAGC 1680 

AAAGGTTTAG ATTCAGGTAC TGCATTTGAA ATTTTATCAA TTGATATTGC TGACGTTGAT 1740 

ATTAGTAAAA ATATTGGTGC AGACTTACaA ACTGAACAAG CATTAGCAGA CAAAAATATT 1800 

GCACAAGCAA AAGCTGAAGA ACGTAGAGCT ATGGCTGTAG CAACTGAGCA AGAAATGAAA I860 

GCGCGTGTAC AAGAAATGCA TGCTAAAGTA GTTGAAGCCG AATCTGAAGT ACCATTAGCT 1920 

ATGGCTGAAG CATTACGTTC AGGTAATATC AGTGTTAAAG ATTATTATAA TTTGAAAAAT 1980 

ATCGAAGCTG ATACAGGCAT GAGAAATGCA ATTAATAAAC GAACTGATCA AAGTGATGAT 2040 

GAGTCACCTG AACATTAAGT CGAGAGGTGA TTAAATGAGT GTCGGTATTC TAATTTTTGT 2100 

CATATCAGTG ATCATTTCTA TCATTACTAC TATGCGCGAA AATAGTCATA AAGATAGACA 2160 

AAATCAAAAG CCACCTCAAA AAACATCTAC CGATAATGAA CCAAAAAAAG GTGGCTTTTT 2220 

20 TGAAGAAATT GAGCGAACGT TTAAAGAAAT AAGTGAAGAA TTAAATGAAG AAGAAAAGAA 2280 

ATCATCGAAA CGAAAATATG ATGATACGTT ACCACCTTTA TTCGATGAAC TTCCAAAGGA 234 0 

AGAGCCTAAA TCGAAACCTG TTGTAGAACC TATGGCACCT AAAAAACAAC AAGAAACAAA 2400 

ACCGATGACA GAGAAACCAA TCACAGTGCC TAAAGCAGAA CCGGTGGAGC AGAAACATAG 2460 

ACCTTCTAGA CAAGATAATT CTGACGAAAT TAGACGTCAA TTAGAAAAAT CACTTAGAGA 2520 

TGATATTAAA ACGATTCGTA CTGACATTGA TAGAGAAAAA GAAAAGCAAA TTGCTAAAAT 2580 

GGAAAAACGT GCTAGAGATA TTATTGAGGA TAAATACTTA TCTGAACGTA CAAAACGTTT 2640 

GAAATTAAAG CAGCTGCTTA ATTCTCAAAA TGTCGAAAAA GATTTGACTA AATCAGCGTT 2700 

CCAATTTGAT AAAGATGAAG TAATCAATGG TATGATATGG TCAGAAATTT TAGCTAAACC 2760 

AAAACAATTA TAAAATTTTT TGAAAACAAG CACTATCGTA ATGGTAGTTG CTTGTTTTTT 2820 

TACGTTAAGG AAAATTAAAA AACAAAGAGA ATTTTTCGAG AAATATTAGT TATTTAAATT 2880 

40 ACAGCAAAAA ATTGATTAGT CTAAAATTGA ATCTGCTTTT ATGACAAGGT GAAAAGTATA 294 0 

AATGATTATT TTAAATTAAA GAAAAATGAG TAAGTCAATG CAAAGATGTT TAAATCAATC 3000 

AATTGCATGA TATAATTAAG TAGATATTAA AGCATCATAG AATGAATATA AATGATATAT 3060 

GAAAAGGAGC GCGTGTATGC CTGGAATTAT ACAAATAGAC GATATGAACC AATCTCAAGC 3120 

TTTAATTGGA AATAATGATG AACATTTAAA AGCAATTGAA GAGAGTTTCG ATGTTGTCAT 3180 

CCATGCAAGA GGACAAGaAG TTGCCGTTAA AGGTACAAAA ATAGAAAACG TAGAAAAAGC 3240 

GGAATCAGTA TTAATCAATT TGCTGAAGGT TATTGATTTA GGTAATAATA TTACAATTAA 33 00 

AGATGTTGAA GCAGCTATTA AAATGGCGCA TAATAACACA ATTCAACATC TGTTAGATTT 3360 
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GCAACGTATA TATGTTAATG CCATGAAAAA TAATGATTTA GTATTTGGTA TAGGTCCTGC 3480 

TGGTACAGGT AAGACATTCT TAGCTGTAGT TTATGCAGCA AAGCAACTCC GTAAAGGTGC 3540 

TGTTAAACGT ATTGTATTAA CAAGACCTGC TGTTGAAGCA GGAGAGTCAC TTGGATTTTT 3600 

ACCAGGAGAT TTGAAAGAAA AGGTAGATCC ATATTTAAGA CCTTTATATG ATGGTCTATA 3660 

TACTGTTCTT GGGCGTGAAC AAACAGAGCG ATTTATTGAA AGAgGCATTA TCGAAATAGC 3720 

GCCACTTGCA TATATGCGCG GACGAACATT AGAAGATGCA TTTGTAATTC TTGATGAGGC 3780 

GCAGAATACG ACACATGCGC AAATGAAAAT GTTTTTAACA AGACTAGGTT TTGGCTCAAA 384 0 

AATGGTAGTT ACTGGTGACC AAACTCAAAT CGATTTACCT AAAGGTGTTA AAAGTGGACT 3900 

TAAGGAAGCG GTCAGTAGGT TACACAACGT TAAAGGTATA AGTATATTGA AATTAGATCA 3960 

GAGCGATGTA GTCAgACATC CATTGGTAAG TAAGATCATT GAACATTATG AAGGAGAGAA 4 020 

20 TTAAATGTTT ACGATAGATT TTAGCGATCA CACAGGCTTA GTTAAAGATG CTTGGTATAA 4080 

ACAAATTGAA GATTTATTAG AATTTGCTAA AAAAGAAGAG CATATAGAAG ACGATGCTGA 414 0 

GCTTTCTGTT ACATTTGTAG ATAAACAAGA AATACAAGAA ATTAATCGAA CATATAGAGA 4200 

TAArGwTAAr GTTmCaGATG tAaTCyCaTT tGCTTTAGrA GrAGATGAGC CmGaGATkGA 4260 

TtTTAGTGGT CTTGATATAC CACGTGTTTT AGGGGATATA ATTATCTGtA CGGATGTAGC 4320 

GCAAGrACAA GCAAACAATT ACGGACATTC TTTTGAACGA GAATTAGGAT TTTTAGCATT 4380 

ACATGGATTT TTGCATCTAT TAGGTTATGA TCATATGACT GAAGCGGATG AAAAGGAAAT 444 0 

GTTTGGTCGA CAAGATACAA TATTAAACGC ATATGGATTA ACACGAGACT AATTATGAAA 4 500 

AGGTTTAAAT ATGCACTTGA TGGGCTGAAA ATCTTAATTC AAAAAGACTA TAAATTTCTT 4560 

TTACATGTGT TTGCAATGAT TGTTGCTATT GTCTTTGGTC TCGTACTAAA TATTAATCGG 4620 

ATTGAGTGGA TATTTATACT CATTGCTATT GCATTAGTTC TCACTGTTGA AGCTTTAAAC 4680 

40 ACTGCTATTG AATATGTTGT CGATTTAGTG ACCGTTGAAT ATCATGATTT AGCTAAATAC 4740 

GCTAAAGATA TTGCGGCTTT TAGTGTACTT ATAGTTTCAA TATTAGCATT TATTATAGGT 4 800 

TTAATAGTAT TTTTACCACA TTTTATAGCG TTATTTTAGG GAGGCATATA TGAGTTATCA 4 860 

ACCTCATTAT TTTCAAGAAG TTAGAAAAGC ACAACAAGAA TCATATTCGC CATACAGTCA '4920 

ATTTAAAGTA GGGGCTTATT TAAAAmCGAA AGACgGTAGA ACTTTTTATG GTACCAATGT 4980 

AGAAAATGCT TCTTATCCAT TATCGATATG TGCTGAACGA GCTAGTTTGG TATCGGCAAT 5040 

TTCTCAAGGA TACAGACCAG GTGATTTTGA ATCAAtAACT GTAACCGTAG ATGCAGATAA 5100 

ACCGTCATCA CCTTGTGGTG CATGTCGTCA AGTTTTGAAG GAATTATGTG ATGATGATAT 5160 
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ACCATTTGGA TTTTCAGGAA AGGATTTAGA AT AAATG ACA GAACATAAAT CAGGATTTGT 5280 

TTCAATTATA GGTAGACCAA ATGTAGGAAA GTCAACATTT GTTAATAGAG TGATCGGCCA 5340 

TAAAATAGCA ATCATGTCCG ATAAAGCTCA AACAACTAGA AATAAAATTC AAGGTGTTAT 5400 

GACAAGAGAT GACGCGCAAA TT AT ATT CAT TGATACGCCA GGTATTCATA AACCTAAACA 5460 

CAAATTAGGT GACTATATGA TGAAAGTCGC TAAAAATACA TTATCTGAGA TAGATGCAAT 5520 

CATGTTTATG GTTAATGCCA ATGAGGAmAT TGGACGAGGC GATGAATATA TTATAGAAAT 5580 

GTTGAAAAAT GTTAAGACAC CAGTATTTTT AGTATTAAAT AAAATAGATT TAGTGCATCC 5640 

AGATGAATTA ATGCCAAAGA TTGAAGAATA TCAAAGTTAT ATGGACTTTA CAGAGATTGT 5700 

ACCTATTTCA GCATTAGAAG GGCTAAATGT CGATCATTTT ATTGATGTTT TAAAGACGTA 5760 

TTTACCCGAA GnACCTAAAT ATTATCCAGA TGATCAAATT TCAGACCATC CTGAACAATT 5820 

TGTAGTGGGT GAAATCATTC GTGAAAAAAT CCTTCATCTT ACAAGTGAAG AAATCCCTCA 5880 

TGCGATTGGT GTTAATGTGG ACCGTATGGT TAAAGAAAGC GAAGATCGTG TTCATATCGA 5940 

AGCAACTATA TATGTTGAAA GAsGTTCGCA AAAAGGAATT GTCATTGGAA AAGGCGGTAA 6000 

25 AAAGTTAAAA GAAGTAGGaA AAcGTGCGAG ACGTGAtATA GaAATGCtTC TAGGCTCTAA 6060 

AGTTTACTTA GAATTATGGG TCAAAGTTCA AAGAGACTGG CGAAACAAAG TTAACTTTAT 6120 

TCGCCAAATT GGTTATGTTG AAGACCAAGA TTAATCTTAA AAGTGGTGAA GATAATTGTT 6180 

30 

AATGCGCCAA AAAGGGATTA TCATCAAAGC AGTTGATTAT GGTGAATCTG ATAAAATTAT 6240 

CACGATTTTA AATG 6254 
(2) INFORMATION FOR SEQ ID NO: 405: 

35 

<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3710 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
40 (D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 405: 
45 GTTGTTCTAA ATGTTTCTTG nATGAAACGA GTCAATGTAA ACTGATATTG CTGTATTTGT 60 
TGCAGCAATT CATATTGGTC TGGTGTTGCA ATAACAGCAG CTTGAGTTGG AGTCGCAGCT 120 
CTGATGTCTG CAGCAAAATC ACTTAATGTA AAGTCTGTTT CATGACCAAC TGCTGATATA 180 

50 

ATCGGTGTCT TACAATTATA TATTGCACGG ACGACAGCTT CTTCGTTGAA ATTCCATAAA 240 
TCTTCTATGG ATCCACCGCC TCGACCTACA ATAATGGTAT CTACACCTAA ACTATCTGCA 300 
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TGTATTTGTT CAGCTAATGG AAAACGACTA TTTATCGTTG AATGGATATC TCGAATTGCG 420 

GCACCTGTAC TCGCTGTTAA AACTGCAATT TTTTTAGGAA ACTTAGGTAT TGATTTCTTA 4 80 

5 

TTCGCTTTAT CAAAACAACC TTCTTCAGTT AATTTTTTCT TTAATGCTTC TAATTTTTGA 540 

TATAAGTTCC CTATACCATC TAATTGCATT TTATTTACAT AAATTTGATA GTTTCCACGA 600 

CGTTCAAAAA CAGAAACACG TGCTTCTAAT AAGACTTCAT CTCCTTCTTT AGGTTCGAAG 660 

10 

TTTAATTTAG AAGCACTACC TTTGAACATC ATGGCACTTA TAACGCTTTC TTTATCTTTC 720 

ACATTAAAGT ATAAATGaCC ACTTGaATGc TTTTTGAAAT TTGAAAGCTC ACCTTTAATC 780 

JS AATACAGATT GGAGATGTGG ATCTTGATCA AATTTATATT TAATATATTT CGTTAAAGCT 84 0 

GAAACACTTA AATAATCTGA CATATAACAT CACTCAATTT TATTTTTTTA TATTACTCAA 900 

TACACCATTT ATAAATTTAT AATGATCATC ATCACTGAAT TGTTTTGTTA ATTCAACTGC 960 

20 TTCATTCATT ACGACTTTAG CAGGTGTATC ACTGTGTAAT ATTTCATATG TTGCCATTCT 1020 

TAAAATAATA CGATCCGTTT TTAATAAACG TGCAATAGTC CAATCTTTTA AATAAGGACT 1080 

AATTGTCTCG TCTAATACAG GTTCGTGATC TTTAACGCCA GAAACTAGCC AATGAATAAA 1140 

25 • 

TTCGAAGTCT AAATCTGGAT TATCGTCTTT AATAAAGCTT ATCGCTTCAT TTATCGTTAA 1200 

ATCACTGTCC TTCATTTCTA ATTGAAATAA AGTTTGAAAA GCTTGCACTC GGGATTCTTT 1260 

ACGACTCATT TTTAACTCCT TCAAACGTTT GTATTTTTCT TTATTTAATT ACTGAATTAG 1320 

30 

GTATGACATT ACTTTTCAAT AACGATTTGT GTAATGTGAA TATTAATTTG CTTAGGTTCT 13 80 

ATCGCTGTCA TATTAGAAAT TGAATTAAAA ATTGACGTTT GAATTTTGTT TGCAGTTTTT 1440 

35 GAAATATTAA CACCATGTTT TAATGCACAA TATACATCTA TATATATGCC ATCTTCTTTA 1500 

CTCTCGATTT TTAAATCACG GCTTAAATTT TTACGACTAA CTTTTTCTAA ATTTGTTTCT 1560 

TTTAATTCAG CAAAATGGCC AGTGATGCCT TCGACTTCCG AAGTAGCTAT ACTTGCAATA 1620 

40 

ACAGATAGCA CTTCTGGCGC TATTTCTACT TTACCTAATT TTGAATTTGA ATAATCAGTT 1680 

ACTTTGACCA TGGATTGACC TCCTATTAAC CTTCATCATT GATAATGCTA TTTTGCTCTA 1740 

AAAAGTTTGT ATTAAATTTA CCGCTTCTAA ATATATCGTT ATTCAATAAT TTAATATGGA 1800 

45 

ATGGAATAGT TGTATCAATA CCAAGAACCA CAAATTCACT TAGTGCACGA ATGCCAGCCA 1860 

TAATCGCTTC ATCTCGTGTC GGTTCATGTA TGATTAATTT CGCTACCATC GAATCATAAT 1920 

SO ATGGCGGTAT CGTATAATTA GTATAACATG CTGACTCTAT TCGAACACCA TATCCACCTG 1980 

GTGCAAGATA TTGCTCmATT TTACCTGGTG ATGGCATAAA GTTCTTGTAA GGATTTTCAG 2040 

CATTAATTCT AAATTCAATT GCGTGTCCTG TTAATTTAAT ATCTTCTTGT TTATACGGTA 2100 
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CAGTTACAGG ATGTTCTACT TGAATACGTG TATTCATTTC CATAAAATAA AATTTATTAT 2220 

CATTTAAATC ATATATAAAC TCAATTGTTC CCGCA TT TTC ATAATTTACA GCTTTCGCTG 2280 

CACGAACTGC GGCATTTCCC ATTTCACGAC GTGTTTCATC ATCTAAAATT GGGGAAGGTG 2340 

CTTCTTCCAC TAATTTCTGC ATACGTCTTT GAATTGTACA ATCACGTTCT CCTAAATGAA 2400 

TTACATTACC ATAGCTGTCC CCAACAATTT GGATTTCAAT ATGGCGGAAG TTTTCGATGA 2460 

ATTTCTCCAT ATAAAGTCCA CCATTACCAA ATGCAGTTTG AGCTTCTTGT TCTGTCATTC 2520 

GGAAGCCAGT TTCAAGTTCT TTTTCATCAC GAGCAACACG GATACCTTTT CCGCCACCGC 2580 

CAGCAGTAGC TTTAATGATG ACCGGATAGC CAATTTTTTT GGCGATTTTC TTAGCTTCTG 2640 

AGACGTCTTT CATTAAACCG TCACTACCAG GAACAACTGG AACATTGGCT TTGATCATTT 2700 

CTGCCTTAGC AACATCTTTG ATACCCATTT TTTGGATAGA TTGATAACTT GGTCCAATGA 2760 

20 ACTTCAATTG GcATgctTCG CATAATTCTG CAAAATCAGC ATTTTCAGCT AAAAAGCCAT 2820 

AACCCGGATG AACGCCATCA CAACCTGTAG AAGTTGCAAT AGATAAGATG TTCGGAATAT 2880 

TTAAATATGA ATCTTTAGAC AAAGTGGGAC CTACGCAATA TGCTTCATCA GCAATTTGAG 294 0 

TATGTAGCGC ATCTTTATCC CCTTCAGAAT AGATTGCAAC AGTTTGGATG CCTAAATCAC 3000 

GACAAGCGCG AATAATCCTA ACTGCGATTT CACCGCGGTT TGCAATTAAA ACCTTTTTCA 3060 

TTATTTCACC TTAAATAACG GTTGGCCATA CTCTACCATT TGTCCGTCTT CTACTAAGAT 3120 

TTCAACAATT TCACCTGAAA TTTCTGCTTG AATTTCATTA AATAGTTTCA TTGCCTCTAA 3180 

AATACACACT GTTGTTTCAT TTGAAACAGT GTCCCCAACT TGCACATATG CTTCTTCGTC 3240 

35 TGGAGATGGC GATTTGTAAA ATGTACCTAC CATAGGTGCA TTAATTGTTT TGTGATTATC 3300 

TGAAGTTGGC TTTGGAGCTT CAGTTTTATT GCTATCAGTT GATTGTGCTT GAGGCATAGG 3360 

CATTGCCGCA GCTTCAACTG GCATTTGTGA GATTTGTGGC GTGATAATCT CAGTTTCTTT 3420 

TTCTTTCTTA AGCGTCACTT TGCCTTTAGT ATCTTCAATA TTGATTTCCG TTAAAGTTGA 3480 

TTTATCCAGA ATTTCAATTA ATT CTTTG AT TTCTTTAAAG TTCATTATTA CTGACTCCTT 3540 

CAGTTTGTTT TCATCTACCC GTCTATTTTA CTTGAGACAA CTCTTCAATT CAAGCATGTT 3600 

CATATTGCTG GCGACATTAT AAGTCTATCC CAAAGTTATA ATAAAACCAC ATTTTAAATT 3660 

AAAAACACTT GTGTATTTAT TACTTAACAT TGACTCATCT TAACTCTTGA 3710 
SQ (2) INFORMATION FOR SEQ ID NO: 406: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1705 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
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<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 4 06: 

5 GCTGATGTTC GTTGCCTTTn TCCACCAGAC AATTCAGAGG GATATTTATC ACTAATATCC 60 

AATATATTTA ATGCTTCTGC TACTTTTTCA TAACGATTTA ACATATGTTC TTTATCTAAC 120 

TTCTGTACCG TTAGTGGTAA CATTATGTTT TCTTTAACAG TCAATGTATG CAGTAAATTA 180 

10 TACTCTTGAA AAATAAAACC AATATCATGC TTGCGTATAT CAGATwATTC CTTGTTTGAA 24 0 

AGCTTTTCTA ATTTTTTTCC TTTTAATGTA ATAGAACCTT GTGAAATATA ATCAATTGAA 300 

CTTAAAACAT TTAATAATGT CGTTTTCCCA GATCCAGAGG GACCCATAAT AGCAATAAAC 360 

15 TCGCCTTCTT CAATAGACAT ATTGATATCT CGCAACACTT CTTGTGCCAT TTTTTTAGTT 420 

CCATATATTT TTGTTAATTG TTTTACTTCT AAAATTGCCA CTTTAACACT CCTATAATTT 480 

ATCTTAACTT CATTTCCTTT AGGCTTTGGC ACTTGTATCT TCAATTTAAC ATATGACTAA 540 

20 

CATCTATCTT ATTATAACGT TGAAGCTGCA TTGATGTATC AATTCTAAGT AACAAAACGC 600 

ATGTTTAAAA TGACAAATTT GTCACTTCCG ACATGCGTTC AACAATTTCA TTTTGTAATG 660 

2S GGAAAATCAA TCTGACAGTT GTCCCCTTAC CAACAGTCGA CGTGACTTGC AGGTGAATAC 720 

CTAATTGATC CTTTACACTA TTTACTAAAT ATAGACCCAT ACCTGAAGAC GTCGTTTCAT 780 

TTCTGTTAGC CGTTGACGTA AATCCTCGTT CAAATATTCG CGGCATATCT TTTTTACTAA 840 

30 TACCTCTGCC ATAGTCTTTA ATATATAACG AAACATGTTG ATCATTTAAT TCTGTCCCAA 900 

TTTCAATATT AAAATTCTCA CTATATTTCA ATGCGTTTGA CAAAATTTGT CTAATAATCA 960 

TACGACACCA TTTTATATCT GTATAAACAT AATCATCCAC TTTAAAGTCA ACATCAAAAC 1020 

35 

CAATACCTTT AACCTGACTA ATATGTCTTG TTAATTGTAT TTCATCAATG ACCATGCGTT 1080 

TAAGTGACAC GTAATCAAAA TACATATCTT TACGTTGAGA TTCTAATCTA GTAATATACA 1140 

GCTGTGTATC TAGCATCGAG TTTATACGAG ACCATTCATA TAGTAATGCT TGTwTTCTTT 1200 

40 

CTTGATTTTT TTCTTGATCA ATTAATAATT TCATAGCTGT CACAGGtGTT TTTATGTCGT 1260 

GCACAAATTC TGTAATGGTT TGTTCATGCA TGTTCAATTG CAACTGTTGC TCAACAACCT 1320 

45 TTTCTTTGTG CGCTGAGATT TGACGATATA AATAATCAAC TGTATGACGT TGAAATGGCG 1380 

TTTCCGCTAA ATCTTTATGT TTAATTTCTT CTATTTCTTT ATCTTTGTCA AAATGCTTAT 144 0 

ATAATTTTAC TTCTTTAAAA TATGTCAATA AAAGAAAAAT CATTGTTAAA CTTAAATTCA 1500 

50 

AAGAAACAAT ATAAAATAAA CTGTCTATTG GAAAATCATA ATCGATTAGA CTArTGCCTA 1560 

ACATAAGGAA GTTTAAAAAC AATATCCAAA AtATCCAGTT CATGCGAGAT TTCAAAAAAT 1620 
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GCACTATCCA TACTAATTTC AGATA 1705 
(2) INFORMATION FOR SEQ ID NO: 407: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1722 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 407: 



15 


TCAATATATC 


TTAAAATTCA 


ATGATTAAAT 


CnATTATCAC 


TAGACATnAA 


ATACATAAAT 


60 




CCTATTCCCC 


ATTTTCATTT 


nTTAATTCAT 


AAATGAATCA 


ATAACCACCT AATAACAAAT 


120 




CATATTATAC 


ACCTTTGTTC 


TCTATTTTTC 


TAAGGTTTAA 


AAAATATTTT 


TAGGTAAACC 


180 


20 


TAAAAATAGA 


TGTAATAAAA 


ACGCCTCCTC 


AGATATTTAT 


ATATCTATGA 


AGACGTTTAA 


240 




ATACATTATA 


GATGGTCTGG 


TTCTGGGTGA 


ACGTATACTG 


AGGAAAtACC 


TTTTTTGTGC 


300 


25 


AAATGATGTT 


CGACATTGTC 


ACAAATTTGA 


TGCGCTTCTA 


CTAAGGAAAG 


GTTAGCATCT 


360 


ACAACAATTG 


TGACATCAAT 


AAACACACTA 


CTTCCATGGT 


AACGCCCTTT 


AATACTTTTA 


420 




ACTTCTTGTA 


CTTCATCAAC 


TTCTAAAATA 


TCATTGCGAT 


ACGCTTCTAA 


TTCAGTTTCA 


480 


30 


TTGAAACCAT 


CACTCAACAT 


AAAAATTGCT 


TCTTTAAAAA 


TACCAAAACC 


AGTATAAACG 


540 




ATTAGTAAGC 


CTAGTAATGT 


TGCTAAAATA 


ATATCGACAA 


TTGGGAAACC 


GATTTGCGTA 


600 




AAAATTAATC 


CTATCGCTGT 


TCCAATGCTG 


ACTAAACTAT 


CCGATAAATT 


ATCTTTGGCA 


660 


35 


GCCGAATTTA 


AAGAACTACT 


TTTCGTTCTT 


TTCGCTAGTC 


TTTGATTGAC 


TGCAAATACA 


720 




ATCAACATTA 


CAAGACCACT 


GATTAAGCTG 


ACGATAATTG 


TTATTGCGTT 


AGGTACAACG 


780 




TCATCTTCTT 


TGAACAAACG 


AGGTGCATTT 


TGAATAACTA 


CTTGGATACC 


TACAAACATA ^ 


640 


40 


ATGACAAATG 


ACACCAATAA 


TGAAGAAATA 


TTTTCAGACT 


TCAAATGGCC 


ATAAGGATGA 


900 




TTTCGATCGG 


CAGGTTTAAT 


TGAAATTTTC 


AATCCAATAA 


TAACAGCTAA 


AGAAACGATA 


960 


45 


ATATCTGTCA 


TATTGTTTAA 


TGCATCGGCT 


CTTACAGCTG 


CAGAGTTAAA GACAAAACCC 


1020 


GTGACATACT 


TAACAATAGA 


TAAGATTATA 


TATACAATTA 


AACTCAAATA AGCACCGCGT 


1080 




TGCGCCAATT 


TAAGATTTTC 


ATTATGAGAC 


ATGCGTTGAA 


CCACCTTGAA 


TTAGTATAGT 


1140 


50 


AACAATATTA 


TGAATGATTC 


ATTTTAATTT 


TACAACGTTT 


TTAATTTTTA 


TAAATTTTTA 


1200 




TAAAATTAAA 


CTAATTTATT 


CATTCGCAAC 


CCCTAAAAAT 


AATTTTTAGC 


CTTTCTGCGA 


1260 




ATTTTATGAG 


CTAGAAAGGC 


GCCCAACTCT 


CCCTGTTTGT 


TAACTTTCGC 


CTCGAAAGTT 


1320 
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CGAAwwTTAT GAGCTAGAAA GGCTTATGCA GTTGACGTTT TACGTCCAAC TGCGTTCCTC 
CGTCTTCTTC AAATTTATTT GTnAGAAAGG CACCCAACTC TCCCTGTTTG TTAACTTTCG 
CCTCGAAAGT TTCTATGTTA GAACCCTATG CATGAGTTGC GAAnTATCTA ATGTCGTGAA 
CTAATTATAT AGAAGAAAAA GTGCATCAAT GACAAATTAA ATGAGATTTC TACTCTACCA 
AACTCTCTTC GAAAGACAAT TTTCTCCTCT ATTTATTAGC AACTATTGCA TTTCTCCATA 
TAGTACTTCC TTACTTAAAA TACGCTGAAT GTCTGAATTA AA 
(2) INFORMATION FOR SEQ ID NO: 40B: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5521 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 408: 



GCGAGACCCC 


CTGAGGGAGC 


AGTGCCCAGT 


CGAAGACCCG 


AGGCTGAGAC 


GGCACCCTAG 


GAAAGCGACC 


ATTyCAATAC 


GAaTTgTGAt 


AAATAGAGAA 


CAGCAGTAAG 


ATATTTTCTA 


ATTGAAAATT 


ATCTTACTGC 


TGTTTTTTTA 


GGGATTTATG 


TCCCAGCCTG 


TTTTTTGTGA 


TTTTTAATAA 


TTTGAATATG 


GAAAATGTAT 


TATTCTCTCA 


TTTGTATAGA 


TTGTATTTAA 


TAAGTTAATG 


TAATCCTTGA 


GCTCACGATT 


AATAAAATTC 


TATAACCTTA 


ATTATTTTCT 


CGATACAAAG 


GGTTATTAAC 


TTTAATATAA 


GTATAATGAT 


GTGCCTCATC 


TTCAAGACGC 


ATTGTTGTAA 


CACACTTATA 


ATCTATAAAT 


GGCGCGAACA 


TGGTATCTTT 


AATTTCaTTT 


ATGCGATTCT 


CATTTACTTG 


ATTAGATTTG 


TGTGTCGAAA 


GTACAAGTTG 


ATCaAAAATG 


TTATCTAGTA 


CATCACGAAC 


GATATACCAC 


ATATGTCTTT 


CTAAGTTTGA 


ATCATTTGAT 


GCTTTAGAGA 


TTGTAAGAAT 


TAATTCGCCT 


AAATGGTTTT 


GAACGGTAGA 


ATAAAAGGCT 


TTGTTAAACA 


CAGACGTTTT 


TGAATCAGTA 


AGAATTCTTG 


ATTTTTCATG 


GAAATGAGAT 


GTACTGTATA 


CCATTTCATT 


TAGTTGTGCT 


TTATCAATTC 


TTAAACCTTC 


AAAGTCTCTA 


ATATACATCG 


TGTCCAATAG 


ACCATCTTTC 


CGAAATGTTG 


CAATAGCATT 


TTGCAAGTGA 


GCCTCTAATG 


CAATGCCATA 


TTTAGTAACT 


AGTGGGATTA 


CGAGACCAAG 


CAATGCTTTA 


CTATAAGTTT 


CAACCCACGA 


TTTCGCCGAT 


GATTCAAAAT 


CAGACAATGA 


TGCAGCTGAT 


TGATAACGTT 


TAATCAATGT 


CACGATAGGT 


GATTCATTGT 


TAAATGGGTA 


GGTTGCAACT 


AAGCTTGAAG 


GAATCAATGG 


TGTGACTTCT 


TGTGGAATCA 


TTTGGTATAT 


ATTTTTTCTA 
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AAAAATGAAT ACCAGCAACT TCATCAATAA TTGTTGATGC ATAGGACTTA AATATGACAT 
CTTTCTCCAA AATATCATTT AAAATACGTG TCATTAGTGG ACCATTGTGC GTCGTTTGTT 
CTGATAATGT ACGAATCTCA CCTGTAATAT GAACGTTTGT CGACAATTTG ATGTGTGGCG 
ACATAGCTGG GTATTTAGGA ACTAATGTTC TGAAAGATAA ACCAGCATAA TAATCCaACG 
TATGTTTTGC TTCAATGATT AATTCTTTAT CTACTTCTGC TTGATAATCA GAATGTAATA 
CGTCATCTAA TTGCCATGGA TGAACAATCA TAATGTGATA ATCATTAAAG TTAAACTTTG 
GCGTAAATTC ATTTTCTAAT TGTTTAATTA AGTCCGGAAA TAGTTGATGA ACAGTTGTAT 
CATAATCTTT AGACAGTGAC ATAGTACGGC TTAATTTACT GTGAATCAGT ACTATTTTCA 
ACTTAATAGG TTGATTGAAT TCTGAAGAAT ATAGGAATGT TTGTAATGCA TTTAAACCTT 
TACGTAATTT AGCCCCAGGA TGTAGCGGAT GACCTTCAAT AACGGCTTGC TCTGAACGCA 
AGTAACTATC TTCGCTATTT TCGATAATAT TAAATAAAGG TGCAGAATCA TGTTGCATTG 
ACAGTGCTTG ATAGCTAATT GCAAATGTCA TATtAGTtGC ACTGTTTATT AAATCTTGCT 
GAAATTGATC ACTAGCAGCA TTTTTTAAAT CTGGTGCTTC AATTAAAATA CACTCAAGAA 
TTTCATTTGG ATGGTGTACT CGTGTAATCG TATTTGTAAT GTCATCTTTA ATGTAGAAAG 
GGCCTTCAAC ATCAATTCGA TCAAAGGCGT GTTCTCCAGT GATAGGAGCA TATAATGTTT 
GCTTAGCTTG TGGGAACTGG ATTTCTAGTA TATGAGTCGT TGAGATATCT AACATAATCA 
AATCACGACT CAATATTTTC TTACTTTGAG TGCGCGCTTT AACTAAGTTT TCGCGATGCA 
TTGATGTGAC CAATCTCTGA GTGACTTTAT CTCTTCCTTG TAAAATCATC TCTTTAAAAA 
TATTAGCCCA ATCGCTATTA TGTTGTTGTA AAAATAAATA TGTTTCTTGT TCTTCTTTGT 
TAAATTTTAA TGTCTGTTCT TTAAAAATTA AGTTCAAGTT CATAATTCAC CTCTATGAAA 
TATTTTACAA AAGCAAGATA GATTTGTATA AT C CAT ATT A ATGATAATGA yTCTTATTAT 
CAACAGAATG CGGGTGTAAG TTTTATGACA AAATATTTTT TTAGCAGTTC TTTTCTACTA 
TTTCTAGGTA ATTGGATTGG ACAAATAGGG ^CTAAATTGGT TTGTACTTAC CACTTATCAT 
AACGCAGTTT ATCTGGGGAT TGTCAATTTT TGCAGACTTG TACCAATATT ATTACTAAGT 
GTGTGGGCAG GGGCAATTGC CGATAAATAT GATAAAGGGC GATTGCTGAG AATTACAATT 
TCATCATCAT TTTTAGTAAC TGCAATTTTA TGTGTGCTCA CGTATAGTTc ACTGCAATTC 
CAATTAGCGT CATTATTATA TATGCGACAT TAAGAGGGAT TTTAAGTGCG GTTGAAACAC 
CTTTAAGACA AGCAATCTTA CCAGATTTAT CAGATAAAAT ATCTACTACA CAAGCTGTmw 
CATTTCATTC ATTCATCATT AATATTTGTC GTTCAATAGG GCCTGCCATT GCTGGTGTCA 



1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
2220 
2280 
2340 
2400 
2460 
2520 
2580 
2640 
2700 
2760 
2820 
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SO 



CAGTTTTATT 
GaTACATGCC 
TATTTATAAC 
TTTTGACAAA 
GTGCCATTGG 
TGGTAAATAT 
TTCACAATAT 
CACGTACGAC 
TACTGAGTAT 
ATATGTGCAG 
TGCATTACAA 
AATCATGGTA 
CGCCATTATT 
AATTGAAATT 
AGAACGCTAT 
TATAACTTTA 
GCGACTACGC 
GTCTCACAGA 
TAACTTTTTT 
TTCTGAGAGT 
CTTAACTATG 
AATTATGATG 
TATTATTGAT 
AGGTTTGAAA 
GATAGGGAAA 
AATACTTcCA 
GTTAAgTTGC 
ACTGTAGATG 
TTTAAAGTTG 



ATGCTTACCA 
GTTAAAAGTT 
ATCATTATTG 
CAAAGTATTT 
TGGTATTATT 
GTATTATTTA 
TGTCATCATG 
AAATCGCGTT 
TaTTATGATG 
ATGTGTTTGG 
TGGTATTCTA 
TATCTTGAAT 
AAAGAACGTA 
CAGTATCATA 
GAGTTTACAG 
GAAGGTTTAT 
GAAGAGTTAA 
CAAACGTTAA 
TCakGGTtAC 
TTGGTACCAG 
GAAGAAGTAC 
ATTGAAAAAG 
GAAATAATTC 
AGTGAAGACT 
TATTTTGAAG 
AAAGCaACTT 
CCgTCGATGC 
GACCAAAGTT 
CTATGGAACC 



TTACATTTTA 
ATTATAGATT 
ATTATGGCGA 
CCGGGGAAAT 
GCAACGCTAG 
AGTTCATTTT 
TTCATTTGTA 
TATTTTCAAA 
GgATAGAGGT 
CATTGTTAGA 
TTTTATAAAT 
GGGCAAAGGC 
TTTACCCCGA 
TGCATGTGTT 
GTGATATTAC 
TAGATGTGTT 
TACACAGTCG 
TAAGTCmAAG 
AACATGTAAA 
AGGGGCATCC 
GAGCATATGC 
ACCATGTTGT 
CCGAATACTA 
ATAGAGCGAT 
CATGGnTTGC 
aTCatTTaGG 
aCAAGCAACA 
AAGTTATGCT 
GTTCGGTGAA 



AAGTAACTAA 
ACTTCAAATT 
CAGGTTTTTC 
CTGAAATATT 
TTTTACCTAA 
TATTTGGCAT 
TTACATTGAT 
ATAATGTTAA 
ATGaTTCCAT 
ACTTTTTCAA 
AGAAAGTTGA 
AGATAGAAAT 
GCAAACATTT 
GACTATTGAA 
TTATTTAAAT 
GAATCATGAC 
AGATAGTTTA 
TTTTAAATTT 
AGATAGTGAT 
AACACACCCT 
ACCTGAGTTT 
GTGCACAGCT 
CAATCAGATT 
TTTAGTACAT 
TAAAAAAATA 
ACGATGTCTT 
AGTGCCGTTA 
TTACAAAACA 
TATGCAAATG 



AATACCTGAA 
ACATATGGAA 
ATATACGACA 
TGGTATCGCT 
AGTACTTAAA 
TGCTTTGTTA 
TGGGTTATTT 
AGATTATGAA 
kGGGAAGTCn 
TAATGGGAAT 
AGTTAAAGTT 
ATTCAATATC 
ATTTCGCAAA 
GTTGTTAGAA 
AAAGGTGAAA 
TTTGAT ATCC 
GTTGAAACAT 
TCAAGGTTAC 
AAGACAGATG 
TTAACCAAAA 
GAAAAAGAAA 
ATGGATGGTA 
CGTGTGTTTT 
CCTTGGCAAT 
TTAATTCCAA 
TAATTGATAA 
GAACAGTCTC 
TGTTGAATCa 
TTGATAAAGA 



GaTGCATCAA 
GGTCGACAAA 
CTTTTACCAG 
ATGACGATGT 
TATATTGGTA 
GGTGTGGTAT 
AGTCAATGGG 
CGTGGTAAAG 
ATTAATGAGT 
AAGTACTATA 
GGAGGAAAGT 
GTGTAATTAA 
AAGGATCTTT 
AAAGTGCATT 
CGTCATTAAT 
CTATTTCAGA 
ATAAGCAAAT 
CACAAGATAT 
ATTTAACTTA 
CGAAATTGCC 
TCCCTTTGCA 
ATGATCAATT 
TAAAGAGTTT 
ATGATCATAC 
CGCCGTTTAC 
ACcATACCAT 
AACTGTGACT 
ATATCCaGGA 
TAGGGCACGT 



2940 
3000 
3060 
3120 
3180 
3240 
3300 
3360 
3420 
34 BO 
3540 
3600 
3660 
3720 
37B0 
3840 
3900 
3960 
4020 
4080 
4140 
4200 
4260 
4320 
4380 
4440 
4500 
4560 
4620 
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AGTGCAAGTC TAGTTAATAA AAATCCAATA GATCAAAAAG TTATCGTGGA TAGTTACTTA 4740 

GAGTGGTTAA ATCAAGGAAT TACTAAAGAA AGTATTACGA CATTTATTGA ACGATACGCT 4 800 

CAAGCATTAA TCCCGCCTTT AATTGCTTTT ATTCAAAATT ATGGAATTGC TTTAGAAGCA 4860 

CACATGCAAA ATACAGTAGT GAACTTGGGG CCACATTTTG ACaTTCAATT TTTAGTGAGA 4920 

GATTTAGGTG GTTCTAGAAT TGATTTAGAA ACATTACAAC ATCGTGTATC AGATATTAAA 4980 

ATTACAAATG ATAGTTTAAT AGCTGATTCT ATAGATGCAG TGATTGcAaA ATTCCAACAT 5040 

GCTGTTATTC AAAATCAAAT GGCAGAATTA ATCCATCATT TTAATCAGTA TGATTGTGTT 5100 

GAAGAAACCG AATTATTTAA CATAGTACAG CAAGTAGTAG CGCATGCCAT TAACCCAACA 5160 

CTACCACATG CAAATGAGTT AAAAGATATT TTGTTTGGAC CAACAATTAC TGTCAAAGCG 5220 

TTGTTAAATA TGAGAATGGA AAATAAAGTA AAGCAATATT TAAATATTGA GTTAGATAAT 5280 

20 CCGATAAAAA AAGAGGTGTA GTACTACATG GCACACGTTA ACATAAATAT ATCGAAGATT 5340 

AAaTATAACG CCAAAGTACT TCAAACAGTT TTTCAAAGTA AAAATATGCA ATTCACACCA 5400 

GTAATTAAGT GCATAGCTGG TGACCGTACA ATTGTAGAAA GCTTAAAAGC GTTAGGTATC 5460 

AATCATGTTG CAGAATCCAG ATTGGATAAC ATAATTAGTA TTGCAGATAC AGGATTTAAC 5520 

A 5521 
(2) INFORMATION FOR SEQ ID NO: 4 09: 



JO 



15 



25 



30 



35 



45 



50 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1261 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 409: 
40 AGGTCGTCTr GCaGmAGmGm TATTTGACGA TCTTGCTTTC CCAAAACACG ATGATGATTT 60 

TAACATACTG TCTGATTATA TTGAGACACA TGGTGATTTC aCATTGCCAA TGTCTGTATT 120 

TGATGATTTA TATGAAGAAT ATACGGAATG GCTAAAATTT TAATATAATT TTTAATAATA 180 

ATAGTTAGAA CCAGGGTGAT GCAATTCGTT ATCCTGGTTT TAATTTAAAA TAAACTAAGT 240 

TGTGACTAAA AATTAATCAA TTATAGTGAA ATATGGTGCG CTATCTTGCA TAAATTGATA 3 00 

TGATTAACTA CACAGAATTT AAAAGTACAT AATACATAAT AAGGAAGTGA TACAATGGAT 360 

GATAAGCAAC ACACATCTTC ATCCGATGAT GAACGCGCTG AAATTGCAAC AAGCAATCAA 420 

GACCAAGAAA CTAATTCATC GAAACGCGTT CACTTAAAAC GTTGGCAATT CATATCAATA 4 80 

55 
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CAAAAAATAA GTGGTTTAAA CAAAACTGAT CAAGCAAACT TAAATAAAAT TGAAAATGTG 
TATAAAATCT TAAATAGTGA TTATTACAAA AAACAGGACT CTGACAAGTT AAGTAAAGCT 
GCAATTGATG GCATGGTCAA AGAATTAAAA GATCCTTATT CTGAATATTT AACAAAAGAA 
CAAACGAAAT CCTTTAATGA AGGTGTTTCA GGTGATTTTG TAGGTATTGG TGCAGAAATG 
CAAAAGAAAA ATGATCAAAT TATGGTTACT AGTCCTATGA AGGGATCTCC AGCAGAACGT 
GCTGGCATTC GTCCTAAAGA TGTCATTACT AAAGTAAATG GAAAATCAAT TAAAGGTAAA 
GCATTAGATG AAGTTGTCAA AGATGTTCGT GGTAAAGAAA ACACTGAAGT CACTTTAACT 
GTTCAACGAG GTAGTGAAGA AAAAGACGTT AAGATTAAAC GTGAAAAAAT TCATGTTAAA 
AGTGTTGAGT ATAAGAAAAA AGGTAAAGTT GGAGTTATTA CTATTAATAA ATTCCaGAAT 
GATACATCAG GTGAATTGAA AGATGCAGTT CTAAAAGCTC ACAAAGATGG TTTGAAAAAG 
ATTGTTTTAG ATTTAAGAAA TAATCCAGGT GGACTACTAG ATGAAGCTGT TAAAATGGCA 
AATATTTTTA TCGATAAAGG AAAAACTGTT GTTAAACTAG AnAAAGGTAA AGATACTGAA 
G 

(2) INFORMATION FOR SEQ ID NO: 410: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2488 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 410: 
AAATATATTG AAnAGAnAAT TACTAAGATT AAATCnTCTT AAAATATCCC TGAAATAACG 
TCCTAAAGAT TAAAGGAAAG AGGTTATAAG TTATGCCAAA ATTAATTTTA TGTCGTCATG 
GACAAAGCGA GTGGAATGCT AAAAACTTAT TTACTGGATG GGAAGATGTT AATTTATCTG 
AACAAGGTAT TAATGAAGCG ACTAGAGCAG GTGAAAAAGT AAGAGAAAAT AACATTGCCA 
TCGATGTAGC TTTTACATCG TTATTAACAC GTGCTTTAGA TACAACGCAT TATATTTTAA 
CTGAATCTAA ACAACAATGG ATTCCTGTAT ATAAAAGCTG GCGTTTAAAT GAACGCCACT 
ATGGTGGATT GCAAGGCTTA AATAAAGATG ATGCTAGAAA AGAATTTGGA GAAGAACAAG 
TACATATTTG GCGTCGTTCT TATGATGTGA AACCACCTGC TGAAACCGAA GAACAACGTG 
AAGCTTACTT AGCTGATCGT CGATATAATC ATTTAGATAA ACGTATGATG CCTTATTCTG 
AAAGTCTGAA AGATACTTTA GTTCGAGTGA TACCATTTTG GACAGATCAT ATTTCACAAT 
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TTAAATATCT TGAAGATGTG TCAGATGAAG ATATCATTAA TTATGAAATT AAAACAGGTG 720 

CACCGCTTGT TTATGAATTA ACGGATGATT TAGAAGTTAT AGATAAATAC TACTTATAAA 780 

AaAAGAGCTG CATGTACACA AGGAGTGAGT GTATATGcAG CTCTTAAAtA TGTGAAGTAA 840 

TGTAAGGAAA TAGTTAAGTA TAGAGTTTAT ATTAACGAGC TAGGGATACT CGAAAATATA 900 

GTTAGACATA CAATATAGTC AAATTAAAAC AATTATTTCG CTCTTTTATG TTGCTTAATA 960 

ATCTTTAAAG CACGCTTTCT TGTTTTAATG TTAGGGCTAT TTAAATTACG ACGAGCAGTC 1020 

TGTAAATCTA ATTTCATCTC TATCCCTCCT TGTAAATATA TTATGACCGA TAACTACTCA 1080 

TATGTAAATA GTAATGATTA CGTTTTAAAG AAATTGTAAT AAAGTCGTGC TAATTTTTTG 1140 

GAAAATGGGT ATAATTACCG GATATCTAAA AATGTGTGTC GTTTTTTAGA TGGTGAGGGG 1200 

GAAGCTTTAA ATGTCGAAGA AACAAAAATT AACGATGATT ATTACTATGC TGATGGGTGG 1260 

20 ATTTTTTGGA TTATTAAATG AAACACTATT AGTGACGGCT TTACCAAGTA TTATGAAAGA 1320 

TTTTGAAATT TCATATACAC AAGTTCAATG GCTGACAACA GCTTTTTTAT TGACTAATGG 1380 

GATTGTTATT CCTTTGTCCG CGCTTGTTAT ACAACGTTAT ACAACAAGAC AAGTGTTTTT 1440 

25 AGTGGGTATT TCTATCTTTT TCTTAGGTAC ATTACTCGGC GGCTTGAGTC CGCACTTTGC 1500 

AACATTATTA GTTGCTAGAA TTATTCAGGC GTTAGGCGCA GGTATTATGA TGCCATTGAT 1560 

GATGACAACG ATTTTGGATG TTTTCCAACC ACATGAACGC GGTAAATATA TGGGGATATT 1620 

TGGTTTGGTA ATTGGTTTAG CACCAGCTAT TGGACCTACT CTTTCAGGTT ACCTTGTTGA 1680 

ATATTTTAAC TGGAGATCGC TTTTCCATGT TGTCGCTCCA ATTGCAGCTG TGACATTTTT 174 0 

AATTGGaTTT AAAACGATAA AAAATGTTGG AACTACAATT AAAgTACCTA TTGATTTTAT 1800 

TTCTGTCATT TTTTCTGTAC TAGGTTTCGG cGGGTTATTG tATGGAACGA GTTCaATTTc 1860 

AGAAAAAGGT TTTGATAATC CTAcGtATTA GTATCTATGA TTGGAGGCGT TGTTTTAGTC 1920 

GCATTATTTG TAwTACGTCA ATATCGGCTA TCAACACCAT TATTaAATTT TGCTGTATTT 1980 

AAAAATAAAC AATTTACAGT TGGTATCATT ATTATGGGTG TCaCAATGGT ATCGATGATT 2040 

GGTTCGGAAA CGATTTTACC TATCTTTGTG CAAAATTTAT TGCATCGTTC AGCTTTAGAT 2100 

45 TCTGGATTAA CTTTATTACC AGGAGCAATT GTTATGGCAT TTATGTCGAT GACTTCGGGT 2160 

GCTTTATATG AAAAGTTTGG TCCTAGAAAT CTTGCTTTAG TAGGTATGGC GATTGTTGTT 2220 

ATTACTACGG CTTATTTTGT TGTAATGGAT GAACAAACAT CAACAATCAT GTTGGCAACA 2280 

50 

GTTTATGCGA TTCGAATGGT TGGTATCGCG TTAGGATTAA TTCCAGTAAT GACCCATACG 234 0 

ATGAATCAAT TAAAGCCAGA AATGAATGCA' CATGGTTCAT CTATGACAAA CACAGTACAA 2400 

55 
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AACTTTTCTC CAACTATGTC AGACTATA 
(2) INFORMATION FOR SEQ ID NO: 411: 

5 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1105 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDN ESS : double 

(D) TOPOLOGY: linear 

JO 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 411: 



15 


TTTTACAATT 


TCAGATATCT 


CTAAAACACA 


TACCGATCCA 


ATGGCCAAAA 


TTATTCGTCA 


60 




AAAATTGAAA 


AAACTAGGAA 


TTCGTAAAGG 


GATTCCAGTT 


GTATTTTCAG 


ATGAAAGTCC 


120 




AATTGTCATA 


AGAGAAGATG 


TAAAAGATAT 


AGTTGGAGAT 


AAAAATGCTA 


TCAATCGAAA 


180 


20 


AGGACAAATG 


CCACCTTCTT 


CAAATGCCTT 


TGTGCCAAGT 


GTTGTTGGAT 


TAATTTGTGC 


240 




AAGTTATGTG 


GTGAATGACG 


TATTAAAAGA 


TATTCCAGTT 


CGTCGCATTA AAGACAAAGG 


300 




GCAATAATTC 


ATTTTGAAAG 


GGATAATTTT 


CAACGTAAGG 


CAAGTGTAAC 


CACACCATAA 


360 


25 


AACTAAAACT 


GACTAGTTCG 


CAAGCATAGT 


AGAATATGCC 


TCGTGTACTA 


GTCAGTTTTG 


420 




ATTTGATTAT 


AGCTAAAATA 


TCAAAGGTAA 


TCGATTTAAT 


CTTATTTTTA 


CGGCCTTTGT 


480 


30 


TTAAGTAAGT 


TGTTATATAT 


TTCTTTGAGT 


TGTTGTTCAC 


TTTTAGATGT 


CGTTTTTGGT 


540 


TCGTAATAAA 


TTTTGTTTTT 


TAGTTTATCA 


GGTAAATATT 


GCTGTGAAAC 


ATAGCCATTA 


600 




ACATATTGGT 


GTGGATATTT 


GTAACCAATA 


GATCGGCCTA 


GATCTTTAGC 


ACCTTGATAA 


660 


35 


TGTCCATCTT 


TTAAATGGTT 


TGGAATTTGG 


CCCACATGAC 


CGTTTCTAAT ATCGGACAAT 


720 




GCACTATCAA 


TGGCACTCAT 


TGCTGAATTT 


GACTTAGGTG 


ATAAGCATAG 


TTCGATTACT 


780 




GCTTGGCTTA 


GTGGAATTCT 


AGCTTCTGGT 


AAACCTAGAC 


GTTCTGCTGA 


TTCAATAGCA 


840 


40 


GCAAGTGTTC 


TCTGACCAGC 


ATTAGGTGAG 


GCTAAGCCTA 


TATCCTCATA 


GCTAATTACA 


900 




AGTAATCGTC 


GAACTATTGT 


AGGTAAATCT 


CCAGCTTCAA 


TTAATCGTGC 


TAAATAATGT 


960 




AAAGCGGCAT 


TGACGTCGCT 


ACCACGGATA 


GATTTTTGGA 


AAGCGCTCAT 


AACATCGTAA 


1020 


45 


TGCATGTCAC 


CATCCTTGTC 


ACTTACAAAT 


GCACCTTTTT 


GTAAACAGTC, TTTAGCATCT 


1080 




TGCAATGTAA 


CATGTCGATA 


ACCGT 








. 1105 



(2) INFORMATION FOR SEQ ID NO: 412: 

50 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 579 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

55 



1311 



EP0 786 519 A2 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 412: 

TAACGTCGAA CTTGAGCTGT TACGTTATGA CTCATAATTA TTTTAGCATA GTCATTTAAA 60 

TAAACTTCTG TTCTGTCTGT TGGATAAGCA AATTCAAGCA ATTGACTGTA ACTATCATTA 120 

ATGACTTCTT GATCAACATG ACTATCAAAA TATACAGCAT AATAATAAGT ACCATCAACC 180 

ATATATAACA AATCTTCAAA CTCTGTAGTT ATTGGATTGC TATGATATGC ATAATTAATA 24 0 

ACATCTTCTA AATCGTTAAA TTTCACAATG ATTGTTCTTG TATTTTTACG TGCTGAAGAC 300 

TTTTGACGTT TAGAACCTTG AGCTTCTTTT TCTTTTGTTC GTTGCTCGAA TAATTCTTCT 360 

AATTGATCTT CACCTTCTAA TGTTTGAGCT AACAATTCTT GAACTTGTTC ATCAAATkGA 420 

TCAGTTGCAT CATCATCAGA CATATTCATC ATATCTTCAT TTTTAGATTT AGAAATTGTG 480 

ACTTCGACAC CTTTTTCAAA GGCATGTACT TGAATCCATA ATGGACCTnC TACAACAAAA 540 

TCTTCTACTT CGTTAATTTC ATCCATCATT GAnCAAAAG 579 



(2) INFORMATION FOR SEQ ID NO: 413: 

(i) SEQUENCE CHARACTERISTICS: 
25 (A) LENGTH: 1342 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



30 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 413: 



45 



50 



GTGGTGAAAC 


TTCTTGCTTT 


GTAATTTTAT 


AAAGTGGATC 


AATATCACTC TGACTTACAT 


60 


CAGGTTGAAC 


TGTCATCTTT 


TTAGTTACTT 


TGTTTTCAAG 


CGTAATATTT GCTAATTcTA 


120 


GGtTTTACAG 


AATAATGAAT 


GTCATCAGCT 


AmCCCTTTmm 


CtTGATACTy CTCTTGATAT 


180 


TTTCCAGCTT 


TAGCATTTGA 


TAAATCAATC 


ACTACTCTTA 


AATCTTCTGG ATTTTCAATT 


240 


TTTATTATCT 


TTGATTGTGG 


TCCTGAAATA 


GTCACATTAA 


CTGTTTCAGG CGCTTTTGTT 


300 


AAATGCAAAT 


CTTTAGTGTT 


ATAAAGAATT 


TCAACGGGTA 


CATCTTGAAT CGTTTTACTA 


360 


GACTTTTGAC 


CAAGATTACC 


AGTGTTAAAG 


ATATTTCCAA 


AAACATTGTT AACAGATAAA 


420 


AAGAAAAACA 


ATGCCAAAAG 


AAAGGCAATA 


AATCTCAAGC 


CCCATTTACT TTCTAGCATA 


480 


TTATTTCACA 


CCTTTCTTTT 


GAAAGCGTGT 


GCCAAACCAA 


TGTTCAGCAA GCAACTCTTC 


540 


AAAAATTTCG 


TTTGAAATGT 


CTCGTCGTAA 


TTTTCCATCA 


AATGTTACCG AAATATCACC 


600 


AGTTTCTTCA 


GATACAATAA 


CGGTAAATGC 


ATCAGATACT 


TCTGAAATAC CAACCGCAGC 


660 
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TGCTGCTGCT GCAATCTTCG TGCCTTGAAT AATCATTGCA CCATCATGTA AAGGTGTGTT 
AGGTATAAAG ACATTAATTA AAAGTTCTTG CGAAATATTT GAATCCATTG CAATACCTGT 
TTCAATATAA TCTTGAAGAC CTGTTTCTTT TTCAAAGACA ATTAATGCAC CTATACGTCT 
TTTAGCCATA TATTGCACAG CCTTTGAAAC GGATTGAATC AATTTCTCTT CATCTTTACT 
ATACGTATTA GAAGTATAGC GTTTTAAAAA GCTACCTCTA CCAAGTTGTT CTAACGCACG 
TCTAATTTCT GGTTGGAATA TTACTATTAA AGCTAATACC CCCCATTGAA TAACGATATC 
GAATAATTTA GATGTTGCAG TCAAGTTCAA TATCATACTT ATCTGCTGAC CAATAACAAT 
TACTAATATC CCTTTAAGTA ATTGTATCGC TTTAGTTCCC TTAAAGACCG TGATGAGAAG 
ATAAAGTACA TACCAAACTA TCAGTAAATC AAGGATACTC GTTACAATTT TTAACGTACT 
GAGGTTTTGA AAAAAGTTGG AAAAATCCAT AACATCTCCT CCGGGTAATA TTTTTCCATA 
ATACCCATTA TACCAATCAT TT 
(2) INFORMATION FOR SEQ ID NO: 414: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1073 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 414: 
CTGTATAAAG ATGGAGGTGT TTTGCATGGT AAAACGTACT TATCAACCAA ATAAACGTAA 
ACATAGTAAA GTTCATGGTT TCAGAAAACG CATGAGCACA AAAAATGGCC GTAAAGTTTT 
AGCGCGCCGT CGTCGTAAAG GCCGTAAAGT TTTATCTGCA TAAGATCACT GACTCATCAG 
TGAtCTkTTT TTTCGTTTAA ATTAAGAATA AATAGAAATT TATGTTATAA GCTCAATAGA 
AGTTTAAATA TAGCTTCAnA TAAAAACGAT AnATAAGCGA GTGATGTTAT TGGAAAAAGC 
TTACCGAATT AAAAAGAATG CAGATTTTCA GAGAATATAT AAAAAAGGTC ATTCTGTAGC 
CAACAGACAA TTTGTTGTAT ACACTTGTAA TAATAAAGAA ATAGACCATT TTCGCTTAGG 
TATTAGTGTT TCTAAAAAAC TAGGTAATGC AGTGTTAAGA AACAAGATTA AnAGAGCAAT 
ACGTGAAAAT TTCAAAGTAC ATAAGTCGCA TATATTGGCC AAAGATATTA TTGTAATAGC 
AAGACAGCCA GCTAAAGATA TGACGACTTT ACAAATACAG AATAGTCTTG AGCACGTACT 
TAAAATTGCC AAAGTTTTTA ATAAAnAGAT TAAGTAAGGn TAGGGTAGGG GAAGGAAAAC 
ATTAACCACT CAACACATCC CGAAGTCTTA CCTCAGACAA ACGTAAGACT GACCTTAGGG 
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TTTAGATACA ATTACGAGTA TTTCAACACC AATGGGTGAA GGGGCAATTG GAATTGTTCG 840 

ATTGTCTGGA CCGCAAGCCG TTGAAATTGC TGACAAATTA TATAAAGGAA AACATCTTTT 900 

AAATGATGTT CCATCACATA CGATTAATTA CGGTCATATT ATTGATCCAG tCTAAAGAAG 960 

TGGTTGAAGA AGTTATGGTG TCTGTGTtAA GAGCGCCAAr AACATTTACA CGCGArGATA 1020 

TTATAGAgAT TAATTGTCAT GGTGGtATTk TAACGATTAA TAGAGTGCTG GGA 1073 
(2) INFORMATION FOR SEQ ID NO: 415: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3176 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY : linear 



20 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 415: 





CTTTACCAAT 


GCCAAATCCG 


AAGTAAAGTA 


TAGCAATAAA 


GATTACTAAT 


ACAATTCTGT 


60 




AAATGGCAAA 


TGGAATTAGT 


TTGATTTTGT 


TAATTAGATG 


CAAGAATGTT 


TTGATTGCAA 


120 


25 


TTAGTCCAAC 


AGTAAATGCA 


GCTAAAAAGC 


CTAAAATATA 


AAAAGGTATA 


TCAGCAATCT 


180 




GAATATCTTG 


ATAATGTTTT 


AATAAAGATA 


AACCACTAGC 


TGCTAACATA 


ATTGGAACAG 


240 




CCATAATAAA 


TGTAAAGTCC 


GATGCTGCTT 


TATGATTTAA 


TTTCATTAAT 


ACCCCAGTTG 


300 


30 


AAATTGTTGA 


GCCTGAACGG 


CTGAAACCAG 


GCCACATAGC 


TACTGCTTGA 


gAAATACCAA 


360 




TTACAAATGC 


TTGGAAATAA 


CTGATTTGAT 


CTACTGTTTG 


TGGGTTTTTA 


ACTTTAGCTG 


420 


35 


AGTATTTATC 


AGCAATAATC 


ATATAGATAG 


CACCTACGAA 


TAAGCCAATC 


ATAACAGTTG 


480 


GCACACTAAA 


TAAATGTTCT 


TCGATGAAAT 


CATCAAATAG 


TAAGCCTAAA 


ATACCTGCTG 


540 




GCACCATACC 


CACTAATACA 


TGTAATAAAT 


TTAAACGTCT 


TGGCTTTGAA 


CGTCTTTGTT 


600 


40 


GATCGTTATC 


TCCTTCAACA 


TGTTTGTGTT 


TACCAATATG 


TAAAATCTCT 


AAGAAGCGTT 


660 




CGCGGAACAC 


CCATGCTGCT 


GCAAAGACGG 


ATCCTAATTG 


GATGACGATT 


TTAAATGTAA 


720 




ATGCTGACTG 


AGAACCTAAA 


AATTCAGATG 


ATTTTAACCA 


CATATCATCA 


ACTAGGATCA 


780 


45 


TATGTCCAGT 


AGAGGAAACA 


GGTGCAAATT 


CTGTTAATCC 


TTCGACGACC 


CCTAAGATAA 


840 




TACCTTTTaT 


TAATTCAATG 


ATAAACATAA 


TGTACCCACT 


TTCATTACTC 


AATTTAATTT 


900 




ATTTAAATAT 


CAAAATTACC 


ATATCATGAT 


AGCATATTCA 


TTTAAAGACA 


TGCTAGTTAT 


960 


50 


AGTTATAATA 


CTAGACTAAA 


GATGTATATA 


TTCATTTTCT 


TTTACATGTA 


AAACTACAAT 


1020 




ATTTTATTGA 


GCTATTTAAT 


TTGATTTTAA 


GGAAAACCTT 


TTATAATAGG 


TTTAGGTGAT 


1080 
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TTCTTGGTCA GTACTGGTCT 


CGGCATAATC GTTATAACGC 


AAAATATTTT 


AATAGCAGAT 


1200 




TTTTTAGCTA AAATTATAAG 


ACATCAATTT CAAGGTTTAT 


GGATTGTATT 


ATTTATTTTA 


1260 


£ 


TTAGGTGTTT 


TACTTTTAAG 


AGCAACTGTG CAATTTCTAA 


ATCAATGGTT 


AGGTGATACA 


1320 




TTAGCATTTA 


AAGTTAAG CA 


TATGCTTAGA CAGCGGGTTA 


TTTATAAAAA 


TAATGGTCAT 


1380 


10 


CCAATCGGTG 


AACAAATGAC 


TATACTCACA GAAAACATTG 


ATGGTCTAGC 


ACCTTTTTAT 


1440 


AAGAGTTATT 


TG CCTC A ACT 


GTTCAAATCA ATGATGGTTC 


CGCTCATCAT 


AATCATTGCA 


1500 




ATCTTTTTPA 


X V.V_r*X X X L-ri/i 


TACCGCATTA ATTATGTTAA 


TAACTGCACC 


ATTTATTCCT 


1560 


15 


x a w a x x xnxn 


x lnl XXI k^vj\j 


TTTGAAAACG CGAGATGAGT 


CAAAAGATCA 


AATGACTTAT 


1620 




TTGAATCAAT 


X IHblLAAHj 


GTTTTTAAAT ATTGCTAAAG 


GTTTAGTGAC 


GTTAAAGCTA 


1680 








AGAGAAGCaT ATTTaCGACG 


ATAGTACTCa 


GTTTAGAACT 


1740 


20 


TTAAfAATfi^* 


wV-Ai 1 1 laLb 


CAGTGCTTTT TTATCGGGAT 


TAATGCTCGA 


ATTTATAAGT 


1800 




ATHTT A CXZT A 


1 XUtaAx lVjVjJ. 


TGCATTGGAA GCAACGCTAA 


GCTTAGTAGT 


ATTTCATAAT 


I860 




AX loAl l 1 in 




AATTGCGATT ATTTTAGCGC 


CTGAATTTTA 


TAATGCAATT 


1920 


25 


A A CZCZ A PTT A fZ 




CCATACTGGA AAACAAAGTG 


AAGGTGCCAG 


TGACGTTGTG 


1980 




XXX UlAw X X X X 


TAGAACAACC 


GAACTATAAT AATGAATTTC 


TATTAAAGTA 


TGAGGAAAAC 


2040 




CAAAAGCCAT 


TTATTCAGTT 


AAGAGACATA TCATTTCGAT 


ATGATGATTC 


TGATAGATTG 


2100 


30 


GTATTAAATG 


ATTTAAATTT 


GGAAATATTT AAAGGTGATC 


AAATTGCACT 


TGTAGGTCCA 


2160 




AGCGGGGCAG 


GTAAATCCAC 


TTTGACACAT CTTATTGCAG 


GTGTTTATCA 


GCCAACAATA 


2220 


35 


GGTACTATAA 


GTACAAACCA 


GCGTGATTTA AATATAGGAA 


TACTTAGTCA 


ACAGCCATAT 


2280 


ATTTTCAGTG 


CTTCTATAAA 


AGAGAATATT ACGATGTTTA 


AAGATATAGA 


AAATAATACT 


2340 




ATTGAAGAAG 


TGCTAGACGA AGTAGGTTTA TTAGACAAAG 


TGCAATCTTT 


CACAAAAGGC 


2400 


40 


ATTAACACAA 


TAATAGGTGA 


AGGAGGCGAA ATGTTATCTG 


GTGGACAGAT 


GAGACGCATA 


2460 




GAACTTTGCC 


GTCTTTTAGT 


TATGAAGCCA GATCTCGTTA 


TATTTGATGA 


GCCTGCAACT 


2520 




GGTTTAGATA 


TTCAAACAGA 


ACACATGATT CAGAACGTTC 


TGTTTCAACA 


TTTTAAAGAT 


2580 


45 


ACAACGATGA 


TTGTCATTGC 


ACATAGAGAT AATACAATTC 


GCCATTTACA 


ACGACGCTTG 


2640 




TATATAGAAA 


ATGGAAGACT 


GATTGCTGAT GATCGCAATA 


TTTCAGTAAA 


TATAACAGAA 


2700 




AATGGTGATG 


ACTTATGAAA 


ACACGACTAA AATTTCAAGT 


AGATAAGGAT 


TTATTGTTAG 


2760 


50 


CTATAGTTGT 


TGGTGTTTGT 


GGAAGTTTAG TTGCGCTCGC 


CATGTTTTTC 


TTAAGTGGTT 


2620 




ATATGGTGAC 


ACAAAGTGCA 


CTTGGTGCGC CACTATACGC 


TCTGATGATT 


TTAGTCGTTA 


2880 
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ATAAAGCTAC ATTTACAATG CTACGTGATA TTCGGGTACA GTTTTTCGGT 



AAATTAGTAA 



3000 



ATGTCATTCC TAATGTTTAC CGTAAACTGA GTTCTAGTGA TTTAATTTCA 



CGTATGATTA 



3060 



GTCGTGTTGA GGCATTACAA AATATAkATT TACGTGTTTA TTATCCACCA 



GTCGTCATCG 



3120 



GTTTGACAGC GCTAGTTACA GTCATAGTTT TGGCGTTCAT TTCAATCGGC 



CATGCG 



3176 



70 



15 



20 



25 



30 



35 



40 



45 



SO 



(2) INFORMATION FOR SEQ ID NO: 416: 

(i) SEQUENCE CHARACTERISTICS: 

- (A) LENGTH: 2109 base pairs 
(B) TYPE: nucleic acid 
(C> STRANDEDNESS : double 
(D) TOPOLOGY: linear 

{xi> SEQUENCE DESCRIPTION: SEQ ID NO: 416: 

TCTTTATTTC AATTTCCAAT TGAATTTTTT TATTATTTAC GCATAGCTCT TAAAATTAAC 60 

GTTACGATTG CAATTAAGAT AATTGAACCA ATTAATGCTG GCAAGATGTA AATACtTCCT 120 

AATTCAGGAC CCCATTGTCC GAATAGTTTG CCACCTACCC ATGATCCAAT AATACCTGCG 180 

ATAATATTGC CTAAAATACC ACCTGGGATA TCTTTACCCA TAATAGCACC AGCAGCCCAT 240 

CCAATTAAGC CACCGACAAT TAACATTCCA ATAAATCCAA ACATAATTTT CAGTCTCCTT 300 

TTTCTATTTA TTTTGCGTTA TTCTAAGTAG TACCCCTTAT TTACAATTCT AAAACAAATT 360 

CAAATTATTT TTATCCAAAT ATTTTTAAAA GTAGTAATTG AATATCAATT TTATTCAATG 420 

TAGCTATCGT TATTTAAAGT CTCTGTACCG ATAATATCAT ATACATTTAC ATTATTTTTT 480 

CTGCCGAATT CATAGCTTGA TTATTTTATG TTATAGGACT AgAATATACA CATATTATTA 540 

GAGCATCTTT GAATTTTAAA TCAAGAAGCG AGGTTAATGA ACAATGAATA TGCATATTTT 600 

ATATaACTTA CGAACTAAAC . ATAATTTAGA AATTGACGAA TTAGCACAGC AATTAAATGA 660 

GAAATATGGT ACTAAATATG AAGCACATCA AATTTGGGAA TGGGAGAATC ATCACCATGA 720 

ACCTAAATTT AAAGATGCCA TGCATTTAGC TGACTtCTTT GATGCACCAT ATGAAATGTT 780 

TTTAGAAAGT AAGGTTAAAG AATATCAGAA ACATTTAGAA GAAGTCGATA TTCGCATGGA 840 

TAAATAGATG CAAATAAACC CTCACAACAC GTTTGGCATA TATCCTTTCA AATCTATACT 900 

GGATATATTA CATTACGTTG TGAGGGTATT TTATTAATTA ATATGAATTA AGACATTTTA 960 

CAAGCGTTAA TGCAACGAAT CTTTTTAGTG ATCTTGCTCA CTCTTTAATA CTTTACCGTT 1020 

CTTAGCATCA ACAGTAACTT CTTGTTTTTT ATTACCTTTT TTCAAATCGA TATTGTAAAC 1080 

AAGTTTGCCA TCATCTTTTT CAAGTGACCA TTCTTTAATA TCACCATCAA ATTCTTTTTG 114 0 
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5 



10 



15 



20 



ATTCATTGTA 


TCTTCTTTTT 


CAGTCTTTTT 


GTTAATCACT 


TTTTTATTTT 


TATCAGCAAC 


1260 


AAGTACTTCT 


GACTCTTCAC 


CAGATTTTTG 


TTGCGTCACT 


TTATAAGCCC 


ATTCACCATT 


1320 


AGAATTTTCA 


AATGAAATTC 


CTTTCAACTT 


TTGGCCTTTG 


TAAGTTTCTT 


CAGCTTTTTT 


1380 


CACAGCATCT 


TCTGGGCTTG 


TTTTAACATC 


TTTTAAAGCA ATAACATCTT 


TTGTTGTATT 


1440 


AGTGTCTTGA 


TTAGTATTTG 


ACTCTGTTGA 


TTTTGTTTCA 


TCTmVGAG 


TATCATTGCC 


1500 


ACATGCAGTA 


AGCACCACCG 


CTGACATTGA 


TAACACTGCT 


AATGATTTTA 


ATTTCATAAT 


1560 


ATCACTCTCT 


CTTCCTATTT 


TTGAAACTCA 


TAACAAAAGC 


TTATATGCTA 


TATAGATTGT 


1620 


ATTACCCCTT 


GTTTTTAATT 


TTATTCATAA 


TTATTACAAA 


TATTTTTAAA 


TTAATCGTCA 


1680 


TGCGTTACTT 


TCGTTCGTAC 


TCCTTTTATA 


AATGAACCAT 


GTAATATAAG 


CATGCTATTA 


1740 


TCGACTCAGT 


TTGTCTAATG 


CTTTCTTTGG 


TACTTCTTCC 


TTTTCAACTT 


CTTCAAAAGT 


1800 


TTCTACATGA 


TGACCTTTAT 


GTGTAATTTT 


CAAGTATCTA 


TGCGGTTTAA 


CATCAAATGT 


1860 


AGCAGTATAC 


ATTAATTGCG 


TCTCTTTCCC 


TTCTTTATTA 


AAAACACTTT 


GACTATAACT 


1920 


TCGGAGTTGA 


TCATCCATTC 


TAGTAGACAC 


CTCTGTCGTT 


TTAACATAAG 


AATCATCCTT 


1980 


CTTTACTAAT 


GGGTTAAATT 


GATCTGTTAT 


ACCATGGGAG 


TCTATTGTTT 


TTAAAATGAA 


2040 


TAAAGCAgCA 


TAAGCGCCAA 


TGATAGTAAG 


TACAAGATAt 


GTkATTGTTT 


TTAAAATCGT 


2100 


TTCAAAAGA 












2109 



(2) INFORMATION FOR SEQ ID NO: 417: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 813 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 417: 

40 



45 



GTTACATAAA 


TGAAAACAAA 


AAAGATAATT 


TTACTGCTTA 


TGCTACACCA GAACATAATT 


60 


ATCAATTTGG 


TGGTGCTATG 


ATAGAAAGTG 


AAAAATTAAG 


CGAGTTACTA AAGCCAGCCA 


120 


ATCAGTTAAA 


ATCACCAGAT 


GATATAAAAA 


AAGAACTAAA 


TAAAAAGAAG AGTCACTAAA 


180 


GTTAGGAGTT 


ACTTTAATGT 


CCAAAAAACA 


TGTTTTTATA 


ATTATTGGTG TCATATTGTG 


240 


TATATGTACA 


GTTTCTACGG 


TCATGCATTT 


TAAAATGAAA 


TATGATGAAA AAGAAAAACA 


300 


AAAAGCGATT 


TACTACAAAG 


AACAACAAGA ACGTATTACA 


CTCTATCTTA AGCATAATAC 


360 


TAAAGAAACG 


AACACGATTA 


AATCTGTACA 


TTTCACAAAC 


TTGGAAACAA GTCCTATGGG 


420 
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10 



15 



20 



30 



35 



40 



ATCGCCTGAA CATAATTATC AATTTGGTGG CGCTATGATA AAAAGTGAAG GAGTAGATAA 540 

ATTATTAAAA CCAGCACATG AAAGAAAATC ACCAGAAAAA ATCAAAGAAG AATTAGATAA 600 

AAAAGAAGGC CACTAGGGTC TTCTTTATTT TTGATTTAAT CTTCCAATAA TCTATGTCAT 660 

TGCTATCGAA GGTGTTTCGC AATTAATATA AATCACTTCA TCATCACCAA TACTTCCCCA 720 

GTTTTGTACA GTACATTAAC ACAAACGAAC CACGTTAATT TAAATGGAwT AaTAGTTTGG 780 

CCATTATAAG AACAATATAT ATCGAnTAAC AAT 813 
(2) INFORMATION FOR SEQ ID NO: 418: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 640 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 418: 

AAAAGCAATC GTTGGTGGTG CTAAATTCAT CGGCAACTCA TATGTAAAAG CTGGTCAAAA 60 

25 TACACTTTAC AAAATGAGAT GGAATCCTGC ACATCCAGGA ACACACCAAT ATGCTACAGA 120 

TGTAGATTGG GCTAACATCA ATGCTAAAAT CATCAAAGGC TACTATGATA AAATTGGCGA 180 

AGTCGGCAAA TACTTCGACA TCCCACAATA TAAATAAGCA ACATGAACAT AGGATCAAAA 240 

GTCATCCCCC ACTATCAATC ATGGGGGATG ACCTTTGATC CCTTTTTTAT ACATACACAA 300 

GCAAAAATAG CGGTGATTGT TTACCATCAA TTTTAACAAT CACCGCTACT TTTGCTTGTA 360 

ATTCATGATT CAATTTTTGT TGTGTGCACA ACGACACTAA ATTATGTGTT TGCTATTGTC 420 

GTGTTACAAC GATATGCGTC GTTGATTTAA CTTATCAAGT AATTGATTTA AATTGTCTAA 4 80 

TTCGACTTCC GATAAACATT GACATCTTGC TTCAATCAAT TCGCAACGTG CATTATTTAT 540 

TTGTGAAATT AATGTACGTG CTTGATCAGT CAAAATTAAT TCTTTACATC TTAAATCTTC 600 

GCTAGATTGT TGACTTGTGA TGTACCCnnT CAAAACTAAT 64 0 
(2) INFORMATION FOR SEQ ID NO: 419: 

45 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1159 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

50 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 419: 
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TTCTTGGATA 


CGTAATAAAT 


TACCTTTTGT 


CATAGGATTA AACATAGATC 


CAGGTAAAAC 


120 




ATAAACATTT 


CTATTTTGCT 


CTAATGCAAA 


ATCTATCGTG 


ATGTGACTGC 


CACTTTGTTC 


180 


5 


CTTAGCCTCA 


GTAATTAAAA 


CCCCTTTTGA 


CAAACCGCTG ATAATTCTAT 


TGCGCTCAGG 


240 




AAATCTATAT 


TTAGCGATTG 


GTGTATGTGG 


TGGATATTCA 


GATATAACTA 


AACCTTTTTC 


300 


10 


TTCTATTTTA 


TTTCTTAATG 


CTAATGTACT 


TTTGGGATAA 


TGTGTTTGAT 


GGCCAAAGGC 


360 


TAAAACTGCA 


ATTGTAGGGA 


GATTGTATTT 


TAAAGCTATT 


TGATGTGCCA 


TTGCATCAGC 


. 420 




TCCTTGAGCA 


AGGCCGGAAA 


CAATTGTTAA 


ATATTTGCTT 


TTATCATTTG 


ATAATAAAAA 


' 480 


15 


TTCTAAAGAC 


TGTTGGGTAT 


AACTTGTAGA 


ATCTCTTGCA 


CCTACTACTG 


CCAAATGATG 


540 


CATATTATTT 


ATTAATTTGA 


TGTTCCCTTT 


ATAGAAAAGA 


AGTAATGGAA 


ATTGATATAT 


600 




TTCTTTTAAT 


AGCACTGGGT 


ATTCAGAATC 


CATATATGTA 


ATGTAACTTA 


CTTTTAATTT 


660 


20 


CTGCAGTTCT 


TTAATAATAT 


CGTTATGATC 


AAGTTTTATA 


AAAGCATAGT 


ATTTACGTAA 


720 




TAAATGAACA 


TTTTCTTCCC 


TATTCACCCA 


TTCACATAAA 


TAACTATCTT 


TTTTTCTTCC 


780 


- 


CTCCTCTTTA 


ATTACATTAG 


GATATGCCAT 


TAAAAATTGA 


TGAATTTGTT 


TAGTCGAAAA 


840 


25 


GTGTGCCCAG 


TATAACTTAA 


GCAAAAATAG 


TTTAATCAAT 


AAATCAACTC 


CTTTTTGTAA 


900 




TCATACAAAA 


TCATATTCTA 


TTTTTGTTTT 


ACATTTCTAA 


TACAAAAACA 


TTGTCGATGT 


960 




AATGTTATTT 


TAAGGAGTAA 


AAATACTGAC 


TTAAAAAGTG 


AAAAGTATGT 


TGGAAAGAAT 


1020 


30 


TTAAAATTTC 


AATTTCCAAC 


ATACTTTATA 


ATTAAACCTT 


ATAAATAAGT 


TTTGCAAATT 


1080 




TATATAGAAT 


TGGTCTTACT 


GGTTTGATGA 


AATCACCAAT 


TAATTCTTCA 


ACATGTGCAT 


1140 




TAAAACCCTT 


TTTAAATTG 










1159 



(2) INFORMATION FOR SEQ ID NO: 420: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1879 base pairs 

(B) TYPE: nucleic acid 
40 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 420: 

45 

TCAATCAGCG ACTACAAGAA GTGCGGGTCT TCAAACAATT GATGTGACAA CACTAAGTGA 6 0 

CCCCACTAAT ATTATCATGG GTATTTTAAT GTTTATAGGA TCTTCGCCAA GTTCGGTTGG 120 
SO TGGCGGTATT CGTACAACAA CTTTCGCTAT TTTAATTTTG TTTTTAATTA ACTTTAGTAA 180 
TAATGCCGAT AAAACATCCA TTAAAGTTTA CAATAGAGAA GTACACATTA TGGATATTCA 24 0 
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ATCAGCTACT 


GAAAATGGTA AGCTTACATT TTTACAAGTA 


TTTTTTGAAG TCATGTCTGC 


360 




ATTTGGAACT 


TGTGGACTAT CGCTTGGTGT 


CACAAGTGAT ATTAGTGATA TTTCTAAGGT 


420 


5 


CGTACTAATG 


ATACTCATGT TTATAGGACG 


TGTTGGCTTA ATATCATTTA TCATTATGAT 


480 




AGCAGGACGT 


CGAGAACCAG ATAAATTCCA 


TTATCCAAAA 


GAACGTATTC AAATAGGATA 


540 


10 


ATATAATAGC AATCTAAGTT TAGTTAATGT AGATTTTAAC 


TGGAACTTAG ATTGCTTTTT 


600 


TAGTTTGTAT 


TTTTAACTTA TTTTATAAGA CGATTGGTTT CGAAAATGGT AAACTAGTAA 


660 




CAATGAGAGG 


TGTAACATGA TGGAAAAAAA 


TGAAAACATT AATGTAGAGA TTTTAACTAC 


720 


15 


GTCAGATATG 


CATAGTCATT JpCTT AAATGG TGATTATGGT TCAAATATTT ATAGAGCTGG 


780 




TACTTATGTT 


AACCAAGTAA GAGCACAAAA 


TCATCGCGTC 


ATTTTATTAG ATAGTGGCGG 


84 0 




AAGTTTAGCT 


GGCTCGTTAG CGGCCTATTA TTATGCTATT GTTGCACCTT ATAAACGACA 


900 


20 


TCCAATGATA 


AAGTTAATGA ACAGAATGCA 


TTATGATGCT 


AGCGGTGTGA GTCCAAGTGA 


960 




ATTCAAGTTT 


GGTTTATCAT TTTTAACTCG 


TTCAATTGCT 


TTGGCACGTT TTCCATGGTT 


1020 




ATCAGCAAAT 


ATTGAATACA ATGTTACTAA 


GGAGCCTTAT 


TTTTCAACTC CATATTGTAT 


1080 


25 


TAAACATTTT 


GGTGACTTAA AAATTGCTAT 


CGTAGGCGTC 


ACAGCAGATG GTTTAATGGA 


1140 




AAATGAGTAT 


TCTGAAATGG AGCAAGATGT 


ATCTATTGAA 


AAGACATTAG TGGCATCAAA 


1200 




ACGTTGGATT 


AGATATATCC ATGAAGTTGA 


AGAGCCAGAT 


TTTTTGATTG TAATTTATCA 


1260 


30 


TGGTGGATTG 


AATAAAATTA GTAATAGTAC 


GAAAAATAAA 


AAGGCAAGTT CGAATGAAGC 


1320 




TGAAAAATTA 


ATGGAAGAAC TCGGTGTTAT 


AGATTTAATG 


ATTACAGCTC ATCAGCATCA 


1380 


35 


AACAATAGTA 


GGTCAAGATC ATGAAACGTA 


TTATGTTCAG 


GCTGGTCAAG ATGCCAAAGA 


1440 


GCTTGTACAT 


CTTTCGATTA ATTTTAAAAA GAGAACAACA ACTTATGATG TTGAAAGCAT 


1500 




TGATTCTAAA 


GTGATTGACT TAAATGAGTA 


TGAAGAGGAT 


CAAGAATTAT TAGATTTAAC 


1560 


40 


ATTCTATGAT 


AGAAAAGCAG TGGCTTATTG 


GTCACAGGAA ATCATAAGTG ATAAAGGTTT 


1620 


GATGTTATCA 


GTAAATGGGT TACAAGATTT AGTCTGTCAA ACA CATC CAT TTTCGCAATT 


1680 




ATTACATGAT 


GCAATTCACC TTGCATTTGA TAATGATATA ACATGTGTCC ACGTGCCTAT 


1740 


45 


GaACGGAGAG 


AAGGGGTTGA GTGGACAGAT 


TCGAAATGAA 


GrTTTGTATC aTGCATACCC 


1800 




ATaTCCAGAT 


aAGCCAtGGG tATGACAATT aGTGGTCAAA ATaTCAAGGT ATnTTGGGGT 


1860 




ATAGTTATTC 


ACCATTAGG 






1879 


50 


(2) INFORMATION FOR SEQ ID NO: 421: 







( i ) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 2710 base pairs 
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(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

5 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 421: 

AATTCCCCCT TTTTCCCCAT CCATTTTnCC ATCCACTGGT CCTTACGGGA CCATATTATT 60 

TnAAATTGGA nAAAATTATt TTAAAGaTTA TwACtACTCT TtAATCATTT TrGTGAATTA 120 

10 

AAAAAAGTAG TGCAAAAAGC AAAATATACT TTATACACTA CAAATCATTT ATTTATAATA 180 

AAGTTTCACC AAAAAATGTT CCAACTAATG AAACCGCTTG TTCAGCAGTA TGATTATTAC 240 

15 TGTCAATCAA TGGATTTACT TCAACTAAAT CCATTGAGGA AATTAAATGT GATTGATGCA . 300 

GTAATTCCAA TGCAAAATGG CTTTCTCTAT AACTAAGACC ACCCAAAACT CTAGTACCAG 360 

TGCCTGGCGT TTCAAGCGGA TCTAAAGCAT CAACATCTAA AGATAAATGA ACGCCATCAA 42 0 

20 CATTGCGTGA CTTCAAATAT TCTATTGTAT TTTCAATTAC TTCCTTTATC CCCAATTTAT 480 

CAATATCTGA CATAGTAAAT GTTTTAATAT TATGATCTTT GATAAATTGT CTTTCACCTT 540 

TATCTAAATC TCTCATACCA ATTAGTACGA TGnTTTCTGG CTTGATTACA TTACnATTTA 600 

25 ATTCTAAAAG TTCTTTGGGA CCTTCGCCTG TCAAAATCCT TAGAGGCATA CCATGAATAT 660 

TTCCACTTGG TGACTCTTCA GGTATATTTA AATCACCATG TGCATCATAC CAAATAACAC 720 

CTAAATTATT ATAATGTTTA CTTATTGCTG ATACTGAACC TACCGCAATA GAATGATCTC 78 0 

30 

CACCAAGAAC TAGAGGAAAT CTGTTATTTT CAATTGATGC TGAAACCTCT TTATTTAATT 84 0 

TTTGATTAAC ATCTATAATT TCATCATAAT TTCTTAATCC TTTTTGTTCA CTATGAAATT 900 

TTTCAATGTT CACAGCAGGt ACCTTAATAT CCCCCTTGTC ATATACATCA AGGTCTAATT 960 

35 

GCTTTAATCT TGAAATTAAT CCAGCATATC TAATTGCTGT TGGTCCTAAA TCAACACCTA 1020 

ATTTTCTTTG TCCAAATGTT GATGGTGCAC CTATAATATC AATTGCTTTT GTCTTTGTCA 1080 

TAAGCGTCCC CCTTTGCTCT ATGTAATTAA AGAATAATGT ATGCGCTTAC CATTATCAAG 1140 

40 

CAATAGCTAC ACATATAATC TGTTTATCTT ATTACTTCAT AAAAAAAGGT TCTTCATCTT 1200 

TTATGGTGGG AAGGTAAAAC TTCCTGCTTT TTTTAATACA CAAAAAGCGC AATTGCCTCT 1260 

45 ATAATTTAAA GTGACCAAAC CCAAACTAAA GGAGACAAGT GCGCCTATGT GTAATGATAC 1320 

CTTAGAATTA CTAAGAATAA AAGATGAAAA TATAAAATAT ATAAACCAAG AAATTGACGT 1380 

CATTATCAAA GGAAAAAAAG CAACAGTGGT TAATGCTGTA CTAACGTATA AGCCTTCGGC 1440 

50 CTGTTATTGT TGTGGAGTTA AAAATGAAGG ACAAATTCAT AAACATGGTA AGCGTGTTTC 1500 

TCGTATTACT TTACTTAAAA CTCAAGGGTA TAACACATAC CTCAACTTAG CTAAACAACG 1560 
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GTGTTTTATC TCAAGATGTG TTACTCAAAA AGTTATAGAA GAAGCTACTA AAGTTAAAAC 1680 

AGAGATTGAT ACTGCAGAAG ATAACTGTAT CTCTCCATCT ACTGTAAGTC GTATTAGAAC 1740 

TAAAGCGGCT AATTCATTAC GAATTAAACC CTTTAATTGT TTGCCAGAAC ACATCGCTAT 1800 

GGATGAATTT AAAAGCGTTA AAAATGTAAC TGGATCAATG AGTTTCATTT TTATAGATAA I860 

TGATACTCAT GATGTTATAG ATATTTTAGA AAATAGAACT ACAAGATTCT TGCGTGCCTA 1920 

TTTCGAGCGA TTCGATTTAA AAAATCGACA ACAAGTTAAG ACGGTTACTA TTGACATGTA 1980 

TGAACCCTAT GTCCGATTAT TTCGCGACCT ATTTCCTAAT GCAGCTATTA TTTTTGACAG 2040 

ATTCCATATC GTTCAACATT TAAATAGAGA ACTTAATAAG TATCGTGTAC AAGTTATGAA 2100 

TGAATACCGT AATAAAAAAG GACCTGATTA TACAATTTTT AAGAATAACT GGAAAGTCCT 2160 

ATTGATGGAT ACTAGTAAAA CCATATTTAG TAAATAGAGA TGGAATAAAT CTTTTAAGGC 2220 

TTATAAACGC TCATCTGACA TTGTAGAATT CATGCTTTCA AAAGACGATA TACTACGACA 2280 

CTCCTACGAA CTTGTCCAAG GATTACGAAA AGACCTAAGG TTATGTAATT GGCCTAAATT 2340 

TATTAATCGT TTAAATTCAG TTAGTAAAAA GTCTGTGAGT AAGGGTGTAT GGAAAGTGGT 24 00 

TAAAT ATT AT AGAAAACATC AAAGGATGTT AAGAAATACA ATTTATTACC CAGCATTTAA 2460 

TAATGGTGCT ATAGAAGGAA TTAATAATAA GATAAAATTA ATCAAGTGAA TTTCTTTTGG 2520 

TTACAGAAAT TTCAACAACT TTAAAGCACG TATAATGATG aTTTTCAGCT TGTACAAAGG 2580 

30 AGaAAAAAAG AAGACAACCA AGCCCAATAA TGGACTGGCC GCCTAATAwA nGGGskCTAA 264 0 

AAGTTgTATT TTTAAAAATA GTTCCTTTAA ATTATATACC CnCCACATTT GGGGGAGGAC 2700 
CTAAAAAAGC 

35 (2) INFORMATION FOR SEQ ID NO: 422: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1027 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



JO 



15 



20 



25 



40 



45 



SO 



2710 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 422: 

CATTTTAATT GtTaAAATTC CAAAAAAtGT ArGTGGATTw AAAGrAAACC CtGTGTTTTT 60 

AAAAGGtACC ATTaAAATAg TTCCGATTGT ACCATCCCAC GTGAAAtTTT TAgTAtTGCC 120 

GGTGaGAGAA AATGCCAATG CAATCATCGC AGTTCATAAT CATCCATCCG GTGATGTAAC 180 

GCCCTCACAA GAAGATATCA TAACAACAAT GAGGTTGAAG GAGTGTGGTT TGATTTTAGG 240 
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5 



JO 



15 



20 



GGGTTACTTT 


GATGAAAATG 


ATTGAAGTTG 


ATAGAATTAA 


TGACGTATCT 


TGTGTATAAT 


360 


ACCTACGAAG 


TACTTTCATT 


GGAGGAAAAA 


TAGTGACTCT 


ATTTATTATT 


ATCGGGGTTC 


420 


TCGTGCCAAT 


GGTTTATACC 


ATGCAGTTAA 


ATATTAAAAA 


TGAACCTGTa 


ACAAAGCGCA 


480 


ATCTTTTAAT 


AACATTAGCT 


TTATCTACGT 


TAGGTATTTT 


AGTAACCGCG 


TTAGCAGGTG 


540 


TAATCGTTAC 


GAAACAAGCT 


TTTCCTTTAT 


TAAGTGTAGC 


AATTGGCTCA 


ATTTTTACTG 


600 


GAATCGTTTG 


GGGCCTTTTA 


CTAAGTGGTA 


GcTACGCGCT 


GATACGATTT 


TTATCTAACG 


660 


CATTTGGGCG 


TAAGTAATAG 


TAATCTGTTC 


ATCAAGTAGT 


ATCCGTGCTT 


GAAAACAAAC 


720 


TAAAACTCCT 


AATGTGGAAC 


TAGTTAAAAA 


ATTCTAAACT 


AGTACATTAG 


GAGTTTTGTT 


780 


ATGCAGAATA 


AATTTAATTG 


TTAAATTGAA 


AGTGCGGTAA 


AAATCCACTA 


TTTATTTGAA 


840 


AAAAATCGAG 


CAACCAAATT 


AAACCTTGAT 


ATCCTAAGTA 


AATACATAAT 


AAAACAAGTC 


900 


CGACATAAAT 


TAAAAATCGC 


AAAATAGAAA 


GTCCAACTCT 


AAAAAGGAGG 


ATGACTAATA 


960 


GTGCTATTAA 


AATAATTGTt 


AGTATACTCA 


ATGCTACAAA 


CCTCCTArTA 


CGCTTTTAAA 


1020 



TCCATAA 1027 
(2) INFORMATION FOR SEQ ID NO: 423: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 569 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 423: 



45 



SO 



CGGCACATTT 


TTAATTTATA 


CATATTTTAA 


AACTAAGTAA 


CAGTTTGAAG 


AAATCGTAGT 


60 


TCAATAATGT 


TAATTGTGAA AATGTATATA AACATAAAAA AATCATGTAT 


AATATATGTT 


120 


GTTAATTAAA 


CAGTTCGAAA 


GCGAGATGAC 


ATTATGGGAC 


GTAAATGGAA 


TAACATTAAA 


180 


GAAAAAAAGG 


CCCAAAAAGA 


TAAAAACACA 


AGTAGAATAT 


ATGCGAAATT 


TGGTAAGGAG 


240 


ATTTATGTTG 


CAGCAAAATC 


TGGTGAACCC 


AATCCAGAAT 


CTAACCAAGC 


TTTAAGGTTG 


300 


GTGCTTGAAC 


GCGCTAAGAC 


ATATTCAGTG 


CCGAATCATA TTATTGAAAA AGCAATAGAT 


360 


AAAGCTAAGG 


GTGCTGGAGA 


CGAAAACTTT 


GATCACCTAA 


GATATGAAGG 


ATTTGGCCCA 


420 


AGCGGATCAA 


TGCTAATTGT 


TGATGCGTTA 


ACAAATAATG 


TAAATCGTAC 


TGCCTCTGAT 


4B0 


GTGCGAGCTG 


CTTTTGGTAA 


AAACGGCGGT 


AATATGGGTG 


TATCTGGATC 


AGTTGCTTAT 


54 0 


ATGTTGTCAT 


GTGGCCACAT 


TTGGTATTG 








569 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3264 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
£ (D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 424: 

10 TGGACCTATA AAATGGATGC ATCCAAATAT GGATGnGGGG TAnGGCGGGa AAATAGGaGG 60 

TTATATAGTA AGTCATTTAA GTCGAATAGC CATCCTTTTT AAAATGAAAA AAATAGAAAG 120 

CTCAATAGTT TGTTAAAGCC TTTAAATAGC GTCGTTACGC AATTTTAGAA TGCTAAAAAT 180 

15 

TGTCACAAAT TTCAAATTAC GTGCTAAAGC TTGAGATATC AATATTTATT GGCGATAGAG 240 

TGTAATTTGA CTCCGCTTAC ATCTCAGTTT TATGTTTGTA ATTTGGTAGC ATAATATTAT 300 

AATAAAATAA AATTGTTAAT CTTTAATTTC AGTATAGATA TTTTTACGTG TAGTCACGTG 360 

20 

TAAAATAAAT TCAATTAGGT TAGGAGACAT AATTATGAAA ACATTTGGTA AAAAGGTTGT 420 

ATTAATCGGA GATGGATCTG TAGGATCAAG CTATGCCTTT GCAATGGTTA CGCAAGGTGT 4 80 

TGCTGATGAA TTTGTAATTA TTGACATTGC AAAAGACAAA GTAAAAGCAG ATGTTCAAGA 540 

25 

TTTAAACCAT GGTACAGTCC ACAGTCCTTC ACCAGTTGAT GTGAAAGCAG GTGAATACGA 600 

aGaCTGTAAA GATGCAGATT TAGTTGTTAT TACAGCTGGT GCACCTCAAA AGCCAGGTGA 660 

^ AACACGTTTA CAATTAGTTG AAAAAAATAC TAAGATTATG AAGAGCATCG TTAAGAGTGT 720 

TATGGATAGT GGCTTTGATG GATATTTCTT AATCGCGGCA AACCCTGTAG ACATTTTAAC 780 

AAGATTTGTA AAAGAATATA CTGGATTACC AGCAGAGCGT GTTATCGGTT CAGGTACTGT 84 0 

35 ATTGGACAGT GCACGTTTAC AATATTTAAT TAGCCAAGAA CTTGGTGTTG CACCTTCAAG 900 

TGTTGACGCT AGTATTATTG GCGAGCATGG TGATACTGAA CTTGCAGTTT GGTCACAAGC 960 

AAATGTAGCA GGTATTTCAG TATATGACAC ATTAAAAGAA CAAACTGGTA GCGAAgcTAA 1020 

40 AGCGGAAGAA ATTTATGTGA ATACACGTGA CGCTGCTTAT GAAATTATCC AAGCTAAAGG 1080 

GTCAACATAC TATGGTATTG CATTAGCATT GATGCGCATT TCAAAAGCCA TTTTAAATAA 114 0 

TGAAAATAAT GTCTTAAATG TTTCTATACA ATTAGATGGT CAATATGGTG GTCACAAAGG 1200 

45 CGTTTACCTA GGTGTACCAA CATTAGTTAA CCAACATGGC GCAGTTAAAA TTTATGAAAT 1260 

GCCATTAAGT GCCGAAGAAC AAGCGTTGTT CGATAAATCT. GTTAAAACAT TAGAAGATAC 1320 

ATTTGATTCA ATTAAATATT TATTAGAAGA CTAAGCCTAT TTTAAGTATT AATTAGAAAT 13 80 

50 

ATATTAATGG TAAGAGGATC TATTAGTGTT GCAGTAACAC GTGGCACTGA TAGGTCCATT 144 0 
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10 



15 



20 



25 



40 



45 



50 



TATGACTCGT GAAAATCTAG TGACATGAAT AAAAATGTTG AGGCGTCATT GAGTATAAAG 1560 

GAAAGTAGTT CTGCATTAAT CACGAaGTAG AGCATGACmA CGAGGAATAA CTATAGGGaG 1620 

ATGGTTTTGG AATGACGAtG TCTTGTATCA ACATGGTACA TTAGGTACGT TAATGGCTGG 1680 

CTTACTAGAA GGCACAGCTA CAATTAATGA ATTGTTAGAA CATGGGAATT TAGGGATTGC 1740 

AACGTTAACA GGGTCTGATG GCGAAtAATA TTTTTAGACG GAAAGGCATA TCATGCTAAC 1800 

GAGCATAAAG AATTTATAGA ATTAAAAGGC GATGAGAAAG TACCGTATGC ATCGATTACT 1860 

AATTTTAAAG CGAGTAAGAC ATTTCCATTG CAACAATTAT CACAAGATGA TGTATTTGCA 1920 

CAAATTAAAA ATGAAATGTT AAGTGAGAAT TTATTTTCGG CTGTTAAAAT TTATGGCACA 1980 

TTTAAACATA TGCATGTACG AATGATGCCT GCTCAGCAAC CGCCATATAC ACGTTTGATT 204 0 

GATTCAGCAC GCAGACAACC TGAGGAAAAA AGACAAGATA TTCGTGGTGC CATTGTTGGA 2100 

TTTTTTACAC CAGAATTATT TCATGGCGTA GGGTCTGCTG GTTTTCATAT ACATTTTGCG 2160 

GATGATGAAA GAGCTTATGG TGGACATGTT CTTGACTTTG AAGTGGATGA CGTTGTCGTT 2220 

GAGATACAAA ACTTTGAAAC ATTCCAACAA CATTTCCCGG TAAATAACGA GACGTTTGTT 2280 

AAAGCGAAAA TAGACTATAA AGATGTGGCA GAAGAAATTA GAGAAGCTGA ATAGTCTAAT 234 0 

ATAATTAAAA GACCTTAGCG ATATTAGGAA CAGGTGGTTC TAAATGCATC GTTAAGGTCT 2400 

TTTTATATTA TATATGTGCT TACATATTTT GTTGATACGC GCGTAAAAAG CTATAAATAG 2460 

30 TATCAAGATA TGGGGTGTCA AGAATGTGTT CACGTGCACG TCGATAAATA AAGCCTTGAA 2520 

TCGCTTCGAC TTCAAGAGGT TGCTGATGCG CAATGTCGTA ATACATGCTC GTTCCCATTT 2580 

CGTCGGGATA ACCTTGATAT ATAGTCATAA TAGTATCGAC AGTTTGTTCT GAAAAGTTTA 2640 

35 ACCCCTCTGC CTGTGCAACA CGACAACCAT CTAGTAATAG CTGTCTACAC AGTGTACGTA 2700 

TTTCAGGATT ATGCATGATT GCAACGGTCT GTCTACCGAG TGCTGTGATA GAATTAATGC 2760 

CCAAGTTAAC TAACAATTTA TACCAAATAG CTTGTTGAAT ATTTGCTTCT AATACAATGT 2820 

CGATTTGACT GTCTTGGACC AAATCTCTAA ATTGTCGAGT TAATGCATTA TCTTGTATAC 2B80 

GTAATTGATA ATCTCTGAAG TGCGTAACAA CATCGCCTTT CTTTTGACCA CTTATATAGA 294 0 

CAACTGCTTG GCATACGTTT TTAAATGAAA TATGTTCGAG TTGACCATAA CCATTTTGGG 3 000 

CTAAAATGAT GAGCGTGTCC TCATGTGCAA GATGAGTTAA ATGAGGAATA ACTGCATCAA 3060 

GTTGATGTGT TTTGACTGCA ATAATAATAA CATCAAATGT GTTTGTGACA TCTTCATAAC 3120 

CTTTCACAAC AATATCTTGT GCAGGTGCAT GTGGTACAGT ATAATATGTT ATTGTTTTGG 3180 

CGTGTCTCCC GATAAGCGTT GTATGAGGCA ATGATTGTTG TAATTCATAG GCAATAGTTG 3240 
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(2) INFORMATION FOR SEQ ID NO: 425: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 796 base pairs 
5 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 425: 



15 



20 



25 



30 



35 



AGAACGAACC 


TTTAATACGT 


ACGTGTCGAC 


CACGAACTGT 


CATGACAAAT 


TGATAAAACG 


60 


AATAGTTTTT 


CATTAGTTCA 


TTGTCACATC AATCACTTTT GTkTCACCTT TAATCACAGC 


120 


ATTTTCATCA 


TAAATATTAA 


TTGAAGCTGC 


TTGATCAGTG 


TTAGTAATTA 


TAATTGGTGA 


1B0 


AATTACAGAT 


TTAGCGTTAT 


TATTAATATA 


TTCAAGGTTG 


AATCTTACTA 


ATGGATCTCC 


240 


GACGTTAACT 


TCGTCACCAC 


TAGACACTAA 


CACTTCAAAT 


CCTTCACCGT 


CTAATTGAAC 


300 


TGTGTCTAAA 


CCGATATGAA 


CTAATAATTC 


TAATCCGTTA 


TCTGCTTTTA 


ACCCAATCGC 


360 


ATGCTTAGTT 


GGAAAGACAT 


TGTCAACACG 


TCCTGCAATT 


GGAGACACAA 


CTTCTCCTTC 


420 


AGTTQGATTA 


ATACCAAAAC 


CTTCGCCCAT 


CATTTTTTGT 


GCGAATACAG 


GATCTGGAAT 


480 


ATCTTCAATT 


TTCACGAATT 


CTCCAGTTAA 


TGGTGCATAA 


ATTGCGATAT 


CTTTCTGAAC 


540 


TTCTTTGCCT 


TTTCCGAATA 


ATTTTTTAAA CATACTTTCC ACTCCTACTT 


ATCAAAATGT 


600 


GATATTAAAT 


CGCCATAACC 


CAATTCTTCT 


AACTTTTCAT 


ATGGAATAAA 


TTGAATTGCA 


660 


GCGGAATTGA 


TACAGTATCT 


TAAGCCGCCA 


CTTTCTTTAG 


GTCCATCATT 


AAAGACATGT 


720 


CCTAAATGAC 


TATTTGATTC 


TTCTGAACGC 


ACTTCAGTTC 


TCAACATACC 


AAATGATTTG 


780 


TCGACTAATT 


CTATAA 










796 



(2) INFORMATION FOR SEQ ID NO: 426: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 33 93 base pairs 
40 (B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

45 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 426: 

ATCCAGCAAA TCTTTCTTAT CACGTTCTGT AATTTTCTTA GTATCCATCT TGATTAGCTT 
TGATAACTTT TCAGCCGTAT CCAACATTTC CGATTGTGTT GTTTTTCGAC CCCTAGTATA 

50 

TGTAATAGCC ATTTTAGAAG CATTATCAAC TAAAACTTTC CCATTTCTGT CTAAAATACG 
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ATGTGAGCCT TGTGCGATTT GTAAATAACC 
TACAATCACA CCAAATATAA AGTTAATTCT 
5 ATTTGATTTT TCTTTTAGTC TTTTTAACAA 

TTTAAATCAT ATATGAATTT AGAAATTATT 

CATTtAAGAG ACCGAACAAG TAATCATACT 

10 

TTTTTCCCAG TTAACTACAT TCCAAAATGC 

TTTTAGGTAA TAAGCGTGTT CCCATACGTC 

TAATGGATTA TCTTGGTTTG GTGTAGTCAC 

75 

CCAAGCCCAA CCTGAACCAA AGCGTGCAGC 
TTCTAAAGAA CCCCATTGTT CTTTAATTTT 
TGGTGAAAGT AACTCCCAGA ATAATGAATG 

20 

AGCAGTTTGG ATGTTAGCTG GTACACTGTC 
AG ATT CT AAA TCTGTACCTT CTACTGCAGC 

2S TCTGTCATGG TGAATTTCCA TAGTTTCTTT 

GTATGGTAAT TTTGGTAATT CAAAAGCCAT 
TAAATAATAA CAAGCAGTGA CTGGTTCAAC 

30 ATTTTCTCTA CTCATTTAAT ATAACTCAAA 

AAGTTAACAG ATTTGCCATA AAATCATACG 
ATAATTTAAA AAATGAGATT TATGCATACA 

35 TTATATTAAT CTTGGcAAGA CTCACATACA 

TTAACACCAG GTAGTGATAA TTTTATCTGA 
TCTCCACACT TTTCACAGAT AAAATGATGA 

40 TTCATTTCAC CATCAAGTTC TGTATTTTCA 

TTTCTATATA TTGTGTCGAA TGAAATTCCA 

TACTTTGCGT TTATATACTT ATCTTCTTCG 

45 

TCTGTATATT TTAAACCGTT CTCTTTTAAA 

ATTAGCTCCC TTTTTAAACT TCATTCGCAT 

AATAACAAGT AGAACTACAA TTACACCACC 

50 

TAAGCCTAAT ATTACTGATA ATTCACCTAA 



TAAACGTAGT ACTAGTACTG CAAAAATAAA 300 

CTTGTTAATT GTATTTTGAA CGATTTCATC 360 

AACTACCTAC CTCTATTCAA AGTCTTTCAC 420 

TCTATCTTTT TGACAAAAAA ATAACGGTCT 4 80 

TTATTTTGTT GCATTATATA ATTCGTCAAC 540 

GCCAATGTAG TCAGGGCGTT TGTTTTGATA 600 

TAAACCTAAA ATAGGTGTTT TACCCTCAGT 660 

AATTTCTAAC TGGCCATTGT TTACGACTAA 720 

TGCTTTGTCA GCAAATTCTT TTTTAAATTC 780 

TTCTACTACA GTACCTTTTT CTTCTGAGTT 840 

GTTTAAATGT CCACCGCCAT TATTACGTAC 900 

TAAATTAGCA ACAATTTCTT CAATAGATTT 960 

ATTTAATTTC GTAACATACG TGTTATGATG 1020 

GTCAAAATGT GGTTCTAATG CATCAAATGC 1080 

AAATAATCAT CCTCCTAAAA TGTCTGTAAG 1140 

AAAGAATTTG CTTAAATTCT ACTACTTATT 1200 

TCAAAAATAA TTAAACATTT TGTATATAAA 1260 

AACGGAGTAT GAAATGAACC TTTATCTTCT 1320 

TCGGACCAAA TGTGCATAAA TCTCATTTCT 1380 

CCATAAACTT CAAGTTTGTG TTTGTGAATA 1440 

TCTATTGGAC AATAATCTAT TACCTTTGTA 1500 

TGATGATGGT TTGTACAAGC GATTCTAAAC 1560 

ATAATTCCTA AATCTTTAAA TAAGTGCAGG 1620 

GGATAATTTT CATCCATAAC TTGTTGTATA 1680 

ACAAAAATAT CTAACATATC TTTACGTTTA 1740 

ATTTTAATAG CATCATTTGT ATTCATTGAT 1800 

TTTCTGATAA GCCATTGTAA TCATAAGTAA 1860 

CGGAGAAATG TCCATATAGA AAGCTAGGAC 1920 

AAATACACTT AGTAATATCA ATTGCTTAAA 1980 
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TATCCCTACA ACACGCATTG AGGCAGAAAT AACCATCGCT ACAATAACAA TAAATAAAAA 2100 

TTGAATCCAT TTAGGAATGC CAATGACTTT ACTATATTCC TCATCAAATG ACAATATAAA 2160 

TAATTCTTTA TAAAACAATG TAATAAACAG AACAACTATG ATGGCAATGA CAATAATCGT 2220 

TGTTAAATCA CTTATATTCA CTGCGCTTAT TGAGCCAAAT AGCAATCCAA CAATTTCTTG 2280 

ATTGAACCCA TCAGCTAATG AAATGAAGAT TGCACTCAAG GCGATACCAG CACTCATTAT 234 0 

AATTGGAATA GCAATTTCTT GGTAAGCAGT GTATGACGTT CTTAATTTTT CAATTAGAAG 2400 

CGCACCTACT ATTGCGAATA AGATTCCAAA CCACATTGGA TTAATAAATA CTAGTGTTGG 2460 

CATAATAGTA AGTAAAAACA TACCGAAAGA TATACCACCT AAAGTTACAT GACTTAGAGC 2520 

ATCAGCTwTA AGTGATAGTC GTCTAACAAc GATAAAAGCA CCGaTTAGAG GCGCAATAAA 2580 

ACCTAtCAAG ATAcCACTAA TTAAAGAGTA CCTCATAAAA TCAAAATTCA ATAATGCATC 264 0 

TATCAATTGT GACACGCCTT TCCATTTTAA ATAAACTCAA ATCTTTATTA ATTACAACAT 2700 

TCTCGATTAT GCTGATGATC GACAAAACGT ACAGGATGTC CATAAATTTT TGAAATTTCA 2760 

ACTTCATCAA GTGATTTAAA CTCATCAGTT GTACCATGGA AATGCAAATG CTTATTTAAA 2820 

CATGCTACTT CAGTAGCAGT ATCTGCTACA ACACCGATAT CATGAGTAAC TAAGATAATG 2880 

GTGATACCTT CTTGTTTTAA TTGATCTAAA GT ATT AT AAA ATTCACTTAC ATGTTTTGCA 2940 

TCAATACCAT TCGTTGGTTC ATCAAGTACT AATACTGcAG GTTCTGAAAT CAATGCTCGA 3000 

GCAATCATTa CACGTTGTTG TTG AC CACCT GATAATTCTG CTATATTTTT ATGAATTAAA 3060 

TCACTTATAT TCAGTCTTTC TAGTACTTTA ATCACTTTTT CATTATCTTT GCTATTAAAT 3120 

GTTTGGAAAA GACGTTTTGT CTTTGTTAAT CCGCTTAAAA CAACTTCTTT AACACTTGCT 3180 

35 GGGAAACCTG AATTAAAGGC ATTTGCTTTT TGTGATACAT AGCTTAATTT AATTGATGTT 3240 

TcTTATTTTT AAAATCAATA CCTTCAACAA AAATCTCACC ACTTTGTAAA GGTAATAACC 3300 

CTAGAATCAA CTTCAATAAT GkTGATTTAC CAGCACCATT TGGkCCAACA AwTGCtAAAA 3360 

40 ATTCACCTTT ATTTATTTTG AATGnnnTAT ATT 3393 

(2) INFORMATION FOR SEQ ID NO: 427; 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1123 base pairs 
45 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
tD) TOPOLOGY: linear 



10 



15 



20 



25 



30 



50 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 427: 
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5 



10 



15 



20 



CCCTGTTTCT 


TAGCCTTTTC 


GTATATGCGT 


TCATAAGAAG 


AATTCTTTTT 


GATTTCAGAT 


120 


TGTAAAGCAC 


TGTTTTCACT 


TGATTGTTTA 


TCTATTTTAT 


AATCTAAATC 


TGCAATCTTT 


180 


CCTCGCGTAT 


CATACGCATC 


CATTTTTAAA 


GATAGCATAT 


AAATACTTAA 


CATAGCAATT 


240 


ACAGTAATCA 


AAGTTATGTA 


TAAAACTTTT 


TCAAATTTAG 


TTAATTGTAC 


AACCACTTTT 


300 


CTCGAAACAG 


TCTTCTTTTC 


GGGCTTAGTT 


TGTGGTTGTT 


GCTTCGGTAT 


ACTATTATAA 


360 


ACTTGTTCGT 


CATATGGTTG 


GTACACTTTT 


TCTACAGCCA 


TTATAAATTG 


CTCCTTATTT 


420 


AAGTATTTCA 


GCTACACGTA 


ATTTCGCGCT 


TCGTGCTCTG 


TTATTGTCAT 


CTAAATCTTC 


480 


TTCTGTAGCG 


GTAATCGGTT 


TACGATTAAC 


ACGCTTTAAC 


TTAGGTGTAT 


ATGCTTCTGG 


540 


TATAACTGGT 


AATCCTCTTG 


GTACCTCTGG 


ACCTTTTTCA 


TATTCTTGGA 


ACACCTGTTT 


600 


ACATAAACGA 


TCTTCTAAAG 


AATGGAAAGT 


GATTACCGAA 


ATCCTGCCAT 


CTACTTTCAC 


660 


TAATTCAATC 


GCTTGTTCTA 


TTGAATCTTC 


AAAAGCTGAC 


AATTCATCGT 


TTACTGCAAT 


720 


TCGTAGTGCT 


TGAAATACTC 


GTTTTGCAGG 


ATGTCCGCCT 


TTTCTTCTTG 


CTTTTGCAGG 


780 


AATACCTTCT 


TTTATAATGT 


CAACTAATTC 


TAATGTTGTT 


GTTATTGGTT 


GTTGTTCGCG 


840 


ATGTGCTTCG 


ATTCTTCGAG 


CTATCTGTTT 


TGAAAATTTC 


TCCTCGCCAT 


AGCGATAAAA 


900 


AATCTTCACT 


AACGCTTCAT 


ATGACCAATT 


GTTAACAATT 


TCATATGCTG 


TTAGTTCTTG 


960 


TGTTTGGTCC 


ATACGCATGT 


CTAATGTTGC 


GTCATGGTGA 


TAACTGAATC 


CTCGTTCTGG 


1020 


AATGTCGAGT 


TGTGGGCTTG 


AAACACCCAA 


GTCGTAATAA 


ATTCCATCTA 


CTTTTTCAAT 


1080 


GTTTAAGTCT 


TTTAATATTT 


GAGTTAATTC 


ACGGAAGTTG 


CTA 




1123 



(2) INFORMATION FOR SEQ ID NO: 428: 



35 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 838 base pairs 

(B) , TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

40 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 428: 
TATATCCTCC AnACCATAAA AATGGAATTA TAGTGAAGAC CGCTATGATC CAGGATGACC 60 

45 

ACGTATTATA GAATCTTTCg ATAGAGAAAC GAATCaACGT ATCCgACATC aCGAAATGAA 120 
ATTAGAAGAT TATAAAGATG AGTTAAGAAG AGAATATCTA AAACAATCTG ACAGAATTGA 180 
AGGAGATGAA TAAGCGTGGG ACTTGATTTT AGTGGTTTAC CAGATTTAGC AGTATTGGAA 240 

50 

CAAATGAAGG AAAAAGAACA GATTAGTGAG GTTATTGCGC CTGAACATGT TCGTATGCAT 300 
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CATTTCAAAA AATTTGAAGA TGATTTTAAA AATGCGGCAC AAGGGGCTTG GGTGAAAAAT 
GCCACAGACG AATTAAAAGA TATTAGTAAT GATTTAGAAA AAATTCAAGA TATTAAAGTA 
TAAAAAGGTA TTAAGAAACA CAATAAGTAT ATAATCCATT TAATAATAAA TGAATTATAT 
AGTTCATAAT TTCGACTATA AGTGGCTATT AGCCATTATT TTTCGGGATC TATGTCAAAT 
CGGACTAATG AATTCAATAA TGGAAGTTAA GCAACCAATC TTTGTTTAAC TTCTTTTTTA 
TTTTTTGGAA AATAAAGTTT TGAACATAAT AAAATTTGAT TATGTTTTAA CGAATTTTGA 
TGTTTCTTGA ACTATATATC ATCTAGTCGT CATTTACAAT TGGTAAATAT GACTTCAAAC 
TGkATGAAGG TGATGGCGAT TAAAAGGCTC ATCCGTAGGT TCTAAAGAAC TAGAnTTT 
(2) INFORMATION FOR SEQ ID NO: 429: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1150. base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

Cxi) SEQUENCE DESCRIPTION: SEQ ID NO: 429: 
nGTGTTCAAA TAATAGAATG GCTAATACCC CAACAATAAA TAGGAATAAA TATGTTGATG 
TCGTAATTTT AGTAAATAAT GAAAATCTAA AATTAGTAAC CCTATTTTGA ATATAAGCTT 
TAACTTCTAA TAATACTGGG AAGCCGATTG ATCCTAAAAT TATTAAAAAT ATAACTATCG 
CTTGTACAAA ATAATCATGT GCATAAGGAA TTAATGACTT ACCTGTAATA TCTAATCCAC 
CATTGGTAGT GGCAGAAATA GAAACAAAAA CACCTTGCAT GATTGCATAT TTTAAATCTG 
GATTATCTCG ATAAAAGTAA AATGCTAATA ACATGGCTCC TACGAGTTCG ATTACAAATA 
TTGATTTTAC AATATCAATA ATCAATTTGA CGGTACCACT CATTGTGTTT TTGTTATTAT 
CTAACATAAT TAACTGACGT TCTCTAATTC CAATATGTTT ACCTAGTACC ACCCATAACA 
TCGTACCAAT TGCCATGACG CCAATTCCAC CAATATTTAA TATCACGAGG ATAATTAATT 
GTCCAAATGT AGAATAGGTA TCGACAATAC TTATCGGAGA CAATCCAGTA ACACTAATTC 
CGGATACGGC AACAAATAAT GTGTCAATTG GATTTACTTC TACACCTGGT TTATGaACAT 
ACGGTAAGTT TAATAATAAA AATGCAATGA CAATTGCGAC GATATAGTAC AATACAATAC 
CTTGTTGAGG GCTTGATCTT TTTAAAAACT GGCTAAAAAT TGACACGTTG TTCACCTCAA 
CATTATTTTA GTTTAATATT AATTTCTTTC TCTTTACCAT CTCTATAAAT CTTCGCTGTA 
ATTGATTTCA AGTCATCTTT ATGACTAAAT ATAATCTGCC TAAAGCGTAA ATCATCTTCT 
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AAACCATTGT TGTCAACTTG ATCTACAACA ACACCGTTCT TAACTTTTCC TGGCAATTTA 
ACTGCTTGTC TTTCAAAACT ATTTAGACTG ACAATATTCT TCATTTTAAC ACCTACATCG 
GGATAGTCAA TTTTACCTTT tGTTTCTAAA TCTTTTACAA TCTTTtGTAC TTCATTAaCA 
GGtATTGCAA 

(2) INFORMATION FOR SEQ ID NO: 430: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 797 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 430: 
AAGAATATTT AGGATTTTAT GTTTCGCAAC ACCCAGTAGA TAAAAAGTTT GTTGCCAAAC 
AATATTTAAC GATATTTAAA TTGAGTAACG CGCAGAATTA TAAACCTATA TTAGTACAGT 
TTGATAAAGT TAAACAAATT CGAACTAAAA ATGGTCAAAA TATGGCATTC GTCACATTAA 
ATGATGGCAT TGAAACTTTA GATGGTGTGA TTTTCCCTAA TCAGTTTAAA AAGTACGAAG 
AGTTGTTATC ACATAATGAC TTGTTTATAG TTAGCGGGAA ATTTGACCAT AGAAAGCAAC 
AACGTCAACT AATTATAAAT GAGATTCAGA CATTAGCCAC TTTTGAAGAA CAAAAATTAG 
CATTTGCCAA ACAAATTATA ATTAGAAATA AATCACAAAT AGATATGTTT GAAGAGATGA 
TTAAAGCTAC GAAAGAGAAT GCTAATGATG TTGTGTTATC CTTTTATGAT GAAACGATTA 
AACAAATGAC TACTTTAGGC TATATTAATC AAAAAGATAG TATGTTTAAT AATTTTATAC 
AATCCTTTAA CCCTAGTGAT ATTAGGCTTA TATAACTTTy ATCAACTAAT AAATTATGAT 
ATAGTAAACT GATGGTTAGA TATTTyTyAA CCATCAGTTT GCGTktATAT TAGTTTTTTA 
TGCTTATTAT TTTTATGAGT TTCACTTTAC ATTATTGATT AATCCATAAG AATAATTAGC 
ACAAAAAGCA GTATACATAA ATTGAGTAAA GAATTTTGTC GATATAACCG nGCGGAAAAA 
TAATAACnTT TTGGATn 

(2) INFORMATION FOR SEQ ID NO: 431: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1466 base pairs 

(B) TYPE: nucleic acid 
(CJ STRANDEDNESS: double 
(D) TOPOLOGY: linear 
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TTTCCAAGAG AAGTTGCGGA AGTAATTAAT AAAACGCATC ATAATAAATT GGTCATTTCG 60 

ATGATTTCGk CACAAATCGA TGCGGATAGA ATGGATTATT TACAACGTGA TGCGTATTTC 120 

ACAGGTGTAT CATATGGTGC TTTTGATATG GAGCGTATTT TAAGATTAAT GCGACCTTCT 180 

AAAGATGAAG TACTAATCAA AGAAAGTGGT ATGCATGCAG TTGAAAACTT TATTATGAGT 240 

CGTTATCAAA TGTATTGGCA AATTTACTTC CACCCAGTTA GTCGTGGTGG AGAAGTGCTG 300 

CTTAATAATT GtTTGAAACG CGCAAAACAG CTTTATAATG AAGGCTATGA ATTTAAGTTG 360 

CATCCACATG ATTTTATTCC ATTTTTTGAA GAGACAGTTA CGATTGAACA ATATGTTGAA 420 

CTCGATGAAG CGGTAGTTAC GTATTATTTG GAAAAATGGA CAAAAGAAGA TGATGCTATT 480 

TTAAGTGATT TAGCAAGTCG ATTTATTAAT CGAGACTTAT TTAAATATAT TCCATTTGAT 540 

GGCTCAATTA TTACAATATC AGAACTGCAA GAACTGTTTG AAGCAGGTGG TATTAATCCA 600 

20 GATTATTATT TTGTGAGTGA AGCATTTTCT GATTTGCCAT ATGACTATGA TCGACCGGGG 660 

TCAAATCGCA AACCGATTCA TTTATTAAGA CAAGATGGTA CGATTAGAGA AATAAGCAAT 720 

CAATCATTAG TCATTCATAG TATTACAGGC ATTAATCGCC AAGACTATAA ATTATATTAT 780 

CCTAGAGAAA TGGTTGCAAA GATTAAAGAT AAGACAATTA GAGAAGCTAT TGAAAATTTG 84 0 

ATTAATGAGC TTAATTAAAC AGGGCTAAAA TTGTTATCGT TAAATATGGA GGTTATATCA 900 

TTGTCTGAGA AAAAAGGCTT TAATTTTAAT ATCATAAAAA ATGACCCTCT AGATGGTCAT 960 

AAAGGTACAA ATATTGGTTC AATTAGCTTA GACAATATTG CACCAGTTTT TATCGATGTT 1020 

GCTAACAAAG AAGCATTTAT TGATATTGGA GGCATGCATG CTCGTGCCAA AGTTGAAAAA 1080 

GGTGTGAAAT GGATTACTGA TAAAGCTGCT GTTGAAGGCG ATGAAGCTAA AGaATATTGG 1140 

TTGTGTTGGG TAACAACAGA ACGTAATGAA CAAGGACCAT ATTACGCTGG TTTAACAGCG 1200 

TGCTATTTAT TAGTGAATAA AGCAATTCGT CGTGGTTATA AAAGTATGCC TGAACATGTT 1260 

40 AATATGATGG ATAAATCAAT GAAACATCAT ATTATCATAG ATCAAATTGG TGACGAGAAT 1320 

AAAGCTATTT TAAAAGACTT TTTAATGAAC CATGATGAAG GTATGTGGAA GCATTCTTCT 1380 

GATGCTTTAC ATCAAGCATT TAATTAAATA TTAGAAACTA AAATTTCCCA ATTAATCTAT 1440 

AAAGATATGA TTCATTTCTC AATGAC 1466 
(2) INFORMATION FOR SEQ ID NO: 432: 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2304 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 432: 

TTGTACGAAT ACAAAGTTGC ATTAATATAG AATCATTTAT GCTTTTTAAT ATCACAAAAC 60 

AAATTGATTA AACTAGCTAA AATAGTCAAA ATTGGAATCA AGATTACATA AATATCATAA 120 

CCTCTAGATA TTAGTATACA TAATATAATT AGCGACCCTA TTATAATTGC TAAATTATAA 180 

GCCAAACTAA TTTTATATTT CATTTCAATT CCCACCTTAA TAGCATTTAT TAAAATTCTA 240 

TAATGTTTAC ATAGACTTCT TAACAAACTT TAACCCAGCT AAGCTAAGTA TTGAAATAAT 300 

TACACCTCCT AATATAAATA TATTACTTAA GCTTAGTAAA GGTATAATTA TACTTATCAG 360 

TCCTAAAGAC AATGTATCCG CTGcATAATT CGaTGtAGAT GAGATACTAA ATACTTTCCC 420 

CATCAAATGA TTTGGCGTTT TTATTTGAAT GGCAACTGAT CTTGTTAGTC CCTCTATAGA 480 

TTGTCCAAGT CCCAATAATG TTGCACCTAT ATATAATATC GCCACACTTG GAAACACATT 540 

AATAATCGAT AAGCCAATTC CGCAAACTAA AACACCAATA CTAAATTTAA AGATTAATCG 600 

CTTTTCTGAC AGCAAACCCA TAATCAATGA CATTAATAAA GATGCTATAC CTAAACATGA 660 

TGTAGCTAGT CCATATACAC CAACGCCCTC TTTTAATATA TTGGAAATAA ACAATGGTAA 720 

TACAACACGC CAAAGGCCAG TATTAATCAA TATGCAGGCA AATTGGATGA TTATAATAAA 780 

TGGAATTTCT TTAGATTGTT TCAAGAATTC CCAAGTTTCA GAAAAATCTT CTTTTGAGTG 840 

TCTATCAATC ATGTTGTTAT TTGTATATTT TAAAAGTGCA TTAAAAATAA ATCCTAAAAA 900 

TAGCAATATA CTACAAATAA AAAAGACGCC AACATTACCA ACTAGTATTA CAATGACACC 960 

AATTAAAGCA GGTAAAATAA TATTTGAGCC TCTTTGCAAA CTATCGATTA ACGCATTACT 1020 

TGTTGCTAAA TGCTCCTCAT CAATAATTTC AGGAAGAATT GCCCTAAACG CAGGATCCGT 1080 

ATAGCAGTTA ATAATGGTGA TAGCTGTAGA TATGGTTAGA AGCGTCAGAT AATTTAAATT 1140 

TGATGTTATT GCAAGTAAAG GAATAATTAT TATAATCAAA CTTAGTATAA GATCAGATAG 1200 

ATAAAGTATT TTCTTTTTAT TATGTTTATC AGAATATGCG CCACCGAAAA TACCAAATAT 1260 

AATAAATGGA AGTGTTTGAC TCATAACCAT CATTGATAAT TTTAAAGATG ATTGGTTTGT 1320 
CAATTCAACA GTAAACCAAA TTATTTGTAA CGAAAACAGC ACAAAACAAC TCCGACGTAA - 13 BO 

GArATTACCA ATCAATAAAT ATGTAAAGTT TCTATTTTTC AAAACTTCTA AATACAACAT 1440 

ATTTATCACC TCTCATAAAA ATAATTGAAT GCATCCACCA GCTTTTTTAG ACCTTCTTCT 1500 

AAACTCTCTT TATCCAAAGC GCAATTAATT CTAATATAAT TTAGTCAGTT AAATATCAAT 1560 

TATTTCGAAA TATACATACT ACTTGAAACA CCATACATAA CCCCCAAAAT GACTACTCAG 1620 

AGGTTATATT CTACTAATTA TGATTATATT AAATATGAAA ATATTATCAA AAAAATCAAA 1680 
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TCATTCTCAT CATATTCTAG GTTGTTTTTA ACAAACTAAA TATAGTGAAT GCAAATCAAC 1800 

TATTATTTAA ATTATGAATT ATTTTAAITC TTTCTTCTAC GAGCCAATAA CATTAATCCA I860 

GCAATTCCAA TTATACTACT AAAGATCAAA CCTTTTTGCG TGCTTTCTAA ACCTGTTTTT 1920 

GGTAATTCTG CTCGTTTTTT CTCTTGATTA GCTACTGATT CTTTAGCAAT TTTAGATTTT 1980 

TTAACTTTAT CATTTTTATC CATTGAATGA ACTGGGCCAT TTGGTTTTGC TCTGTCTTTC 2040 

GATAATCCTG GATTGTTAGG ATTTACTGGG CCACTTGGAT GAGTTGGTCT GCTCGGCTTC 2100 

TCTGGGTTTT CAGGTCCTTT TGGATCTTTT GGTTTCTCTC CACCGAACTC TACAATCTTA 2160 

TCTACTGGTT GTTTtGTGAT CTCTTCTGTT GGTTGACCCT CGCCAACTTT TTCACCTGTT 2220 

AATGGGkTCA CTGTGAwTGG TGkTGTGAwT GTCyTACTTC CTGGkTGTCC TTCTTGTTTC 2280 

ACTCGCTCTT CACCAGGTTG TAAT 2304 
20 (2) INFORMATION FOR SEQ ID NO: 433: 

(ij SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4733 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
25 (D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 433: 

GTCTTAATAT TTTACAAGAT' ACAGCCTGAC AATATTTATA TTACAAACCA ATATGGTAAA 60 

GAGGCTGTGT CTCGATTAAA AAGAATTTTA GAGCAAAGTA TACCTAATAA AGAATATATT 120, 

GATTTATCAG AGATATCATT AATTACATTT TTTAAACCAG AATATAATAA ACAACATGTG 180 

AATGAGGAGT TTAATTCTTT ATCTTCTTCG AAAATAAAGA ATTTAGCCAA AGAAAATGAT 240 

GGTATTATTA TTTATTTAAA TTTTAAGGAT GTTAATTATC AACTGaTAaG TGAAGGCAAT 300 

4 0 ACTTTTTTTT CTGCAAAACC ATATTTGCAT TGTGTGTTCA ATAAAGATAT TTTAAATATG 360 

GATAAAGTTG ATATAGAAAA TTTTTTCAAA AGTATAGAAG TCAAATACAG TAAATAAGAT 420 

CAATTATTGA* ATCCACCGAC CAGCAGATTT TTTTAAAAAA TTAATACCCC GTTAATACCC 480 

TTTGCTTCAA TTTGATGAAA ATCAATGAAA TTCAAAATTG AAGAAATCCT TTAATATCAA 540 

. GGTGTACGAC AGTCTATATA ATCATGCGAA ATTCTAAAAT TTTCtGAcGT AAAAAAACAA 600 

ATTCyTAAAG CAGCTCGTCG TTCACCTCAA TTCTCAAAAC GTTAATTGTC GGACGATATA 660 

TATACAAAAC ACCTCGATGT TATGTCGAGG TGTTTTTTTG CGTTTGTGTG GGGAATATGG 720 

AATAGAGTAT AAATGAATTA ATGTCTCAGG TATAGAATTA ATTCAACTAT GAATTATTGA 780 
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TTAGCTTGCG GAGACCGTAC GATAGTGTTC TAATAATAGA TATTCAAGGG AAAGAGCTAT 900. 

CGGATGATAA CCAGATGATA ACTCAAGAAC CATGrTTTAA GAGTGTTATC AAAATAAGGA 960 

GTGACTTAAT TGAAAGATTC TATATTTTGG AAGAAAGCTT TTATTyCTGT TTATTTTATT 1020 

GTTGsGATGC TGGTGTTTCT ACTTTTTAGG TTTTATATTA AaACAGATAA CTTTTCTATA 1080 

TATTTAATGA GTATCTTCTT AATTTGTTTA GGAACTGCTT CTATCATTTA TAACTATAAA 1140 

ACCAATCGAT AAATATAAGT ATGAAATGTA TAAGTCACAG TTAGATCTAA GTCTTGCTGT .1200 

GGCTTTTTAT ATCTCCATAA AACGACAAAT TCAAGCCCGA CATAAAACAG CATTTTCAGC 1260 

CCACCATAAA ACGACAATTT CAGCCCGCCA TTGACTAAAC ACCACATCCC AAAAATATCG 1320 

TAACAATCCT CTACATCAAT CAATCCAACA TCCCTCATAA TCACAACGCA CAAAATCTAT 1380 

TCATGCATTT TTGGAATACT TAGTATTACA AATAACGATT TTTATTCATC TAACAAAGGT 1440 

20 TATATAATGT ACTGAAGGCA ATTTTTATGT ATTACAAATC TAATCGTACA TGTAAAATTT 1500 

TGATAAACAT CATTAATTTT GCGTAACTAT CATTAGATTA CAAATCACAA AGTAATTACA 1560 

TGTAATACAC ATCTATACAT CACATTTGAA GGGAAATGaA TATAAATGAC TGATAAAAAG 1620 

TACACTGCAG CCGATATGGT TATTGATACT TTGAAAAATA ATGGGGTAGA ATATGTTTTT 1680 

GGTATTCCGG GTGCAAAGAT TGACTATCTA TTTAATGCTT TAATTGATGA TGGTCCTGAA 1740 

CTTATTGTCA CTCGTCATGA ACAAAACGCC GCAATGATGG CGCAAGGTAT TGGAAGATTA 1800, 

ACAGGCAAAC CGGGTGTAGT ACTTGTTACA AGTGGTCCTG GTGTAAGTAA TTTAACTACT 1860 

GGATTATTAA CCGCAACATC TGAAGGGGAT CCTGTATTAG CGTTAGGTGG CCAAGTGAAa 1920 

CGnAnATGAT TTATTACGAT TAACGCATCA AAGTATTGAT AATGCTGCGC TATTAAAATA 1980 

TTCATCAAAA TATAGTGAAG AAGTACAAGA TCCTGAATCA TTATCAGAAG TTATGACAAA 2040 

TGCAATTCGA ATTGCTACTT CAGGAAAAAA TGGCGCAAGT TTTATTAGTA TTCCGCAAGA 2100 

40 CGTTATTTCT TCACCAGTTG AATCTAAAGC TATATCACTT TGCCAAAAAA CAAATTTAGG 2160 

AGTACCGAGT GAACAAGATA TTAATGATGT CATTGAAGCG ATTAAAAATG CATCATTTCC 2220 

TGTTTTATTA GCTGGTATGA GAAGTTCAAG TGCAGAAGAA ACAAATGCCA TTCGCAAATT 2280 

AGTTGAGCGC ACGAATTTAC CAGTTGTAGA AACATTCCAA GGTGCAGGTG TAATTAGTCG 2340 

TGAATTAGAA AATCATTTCT TCGGTCGTGT GGGCTTATTC CGCAATCAAG TTGGTGATGA 2400 

ATTATTACGT AAAAGTGATT TAGTTGTTAC AATCGGTTAT GATCCAATTG AATACGAAGC 2460 

TAGTAACTGG AATAAAGAAT TAGAAACACA AATTATCAAT ATTGACGAGT TCAAGCTGAA 2520 

ATTACTAATT ATATGCAACC GAAAAAAGAG TTGATTGGTA ATATTGCTAA AACGATTGAA 2580 
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TTTCTTTAGA TTCACTACTT TTTTATTACC ATCATTCAAA GTAAGCGTAT AAGTTGCTGT 4500 
TTGGGCATTA TTAATTTTTT CTGTTGTAAC ACCACGTTGA GAAGCTAATT CATTTTTTAC 4560 

5 

TTTACTGTCA ATTTCTTGAT AAAGAACATT TTTATTTTCT GGGAAGATAA AGTAAGTTCG 4620 

•a 

ATGTAATGCA GTAATACCAT CTACTGAAAT TGTGTAAGGA ACAGTGTGAT AACCATCCAC 4680 
AGTCATTTCT TTATAGCCGT TATTACTATC TGCAGATGCT TCGTGACTCG GTA 4733 

10 

(2) INFORMATION FOR SEQ ID NO: 434: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1284 base pairs 
r5 TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ IDNO: 434: 
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AATAAATGGT 


AATTTTATAT 


CATCAACGGC 


TACAAATGGG 


GCAGTTTCAT 


ATATAAATAA 


60 


ACACATCTAC 


TCAACTGnTC 


TTAATTAATT 


AATAAATGAT 


TTACCAGATG 


ACATATAACA 


120 


GCCATTATTA 


GnTTAATTCT 


AATAGTTTAT 


TTAAATTTTC 


TTCGGTTGTC 


GCCCAACTGG 


180 


TTGCGAATCT 


AACAACACGA 


TGTTGATCAT 


CGTATTTTTC 


CCAAACAGCA 


AATTTAACTT 


240 


TTTGTTCTAA 


' CTCTGCTATT 


TTCTCGTTAC 


TTAAAATAAA 


AAATTGTTGA 


TTGGTTGGAG 


300 


AATCAAAGTA 


AAGACGATAG 


CCTTTATTTT 


TAAACCCGTC 


TTTCATCTTA 


TTTGCCATTT 


360 


CGATAGCATG 


TCTGCTTATA 


TTAAAATATA 


AATTGTCCGT 


AAATAATTCT 


AAAAATTGTA 


420 


TGCCTGTTAA 


CCGTCCTTTT 


GCTAAAAGGG 


CACCGTGGAT 


GCTTGATTCG 


AGTGGTAAAT 


480 


TGTTTCGGTT 


CATTATTTTT 


CGTAAAAACA 


ATGGCTTCCC 


CGCATAATGC 


ACCTATCTkC 


540 


GTACCACCTA 


TATAAAATAC 


ATCACAATAT 


TTAGCGrTGt 


CTTTAATAGT 


CATATCTGAT 


600 


TGGTCACTCA 


TCAATCCATA 


CCCTAATCGT 


GCACCATCCA 


TAAATAATGG 


AAGCTGATAT 


660 


TGCTTACATA 


CTTTGCATAA 


CTCTTCCAAT 


TCTGaTTTAG 


AGTATAATGT 


GCCATATTCT 


720 


GTAGGATGAG 


AAATATATAC 


CATTCCTGGG 


AATACCATAT 


GGTCCTTTTT 


AAAATCACTT 


780 


TTAAATGTCT 


CCATGTAAGT 


TTCAACATCT 


GAAGCACTAA 


CTTTTCCTTC 


CTTAGAGGGT 


840 


ATAGTAATTA 


CTTTATGTCC 


ACTATATTCA 


ATTGCACCGC 


CCTCATGCAC 


AGCAACATGA 


900 


CCAGTGTCTG 


CTGAAATGAC 


CCCTTCGTAA 


CTTTCTAACA 


TTGAATTAAT 


AACAACCTGA 


960 


TTGGTTTGTG 


TTCCACCTaC 


TAAAAAACGA 


ATTGTAGCAT 


TTGGaCAGTC 


AATTGTATCT 


1020 


TTAATCTTTT 


CAATTGCCTG 


AGCTGTGAAT 


TGaTCAAAGC 


CATATCCCGA 


AGCTTGTACA 


1080 
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TCGAATGAAA TCACTACATT TCCCCCTAAA ACTAATATCA ACATTTTAAT AAGATAAACC 1200 

AATTTCAAAA CTAGTTCGAT ATTTAAAATG TATTATGGAT GGnTAAAGTT TGTATCGCAT 1260 

TATCGCGAAG TTGnATAAAT ATAT 1284 



(2) INFORMATION FOR SEQ ID NO: 435: 

(i) SEQUENCE CHARACTERISTICS: 
*o (A) LENGTH: 1072 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



15 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 435: 





ACAGCTTTTG 


GTAArGGAGA 


AAwTCAaTAt 


GAAACAGTAT 


AArGCGTATT 


TaATCGATTT 


60 


20 


AGATGGCACA 


ATGTATATGG 


GAACAGATGA 


GATTGATGGA 


GCAAnACAAT 


TCATCGATTA 


120 




TTTAAATGTA 


AAAGGCATTC 


CTCATTTATA 


CGTAACTAAT 


AATTCAACAA 


AAACACCTGA 


180 


25 


GCAAGTAACT 


GAAAAATTAC 


GTGAAATGCA 


CATTGATGCT 


AAACCAGAAG 


AGGTTGTAAC 


240 


GTCAGCGTTA 


GCCACTGCTG 


ATTATATTTC 


AGAACAATCA 


CCAGGAGCAT 


CAGTATATAT 


300 




GTTAGGTGGG 


AGTGGTTTAA 


ATACTGCGTT 


AACCGAAGCG 


GGACTTGTCA 


TTAAAAATGA 


360 


30 


CGAGCATGTT 


GATTATGTAG 


TTATTGGACT 


TGACGAACAA 


GTTACATATG 


AAAAGCTTGC 


420 




GATTGCAACG 


TTAGGTGTAA 


GAAATGGtGC 


AACATTTATT 


TCTACAAATC 


CTGATGTATC 


480 




AATTCCTAAA 


GAGCGTGGTT 


TATTACCTGG 


TAATGGTGCT 


ATTACAAGTG 


TTGTAAGTGT 


540 


35 


ATCGACAGGT 


GTATCGCCAC 


AATTTATTGG 


TAAACCAGAA 


CCGATTATTA 


TGGTTAAAGC 


600 




ATTAGAAATT 


TTAGGATTAG 


ATAAATCCGA 


AGTTGCTATG 


GTAGGCGATT 


TGTACGATAC 


660 




CGATATTATG 


TCTGGTATTA 


ACGTAGGTAT 


GGATACGATT 


CATGTACAAA 


CAGGTGTATC 


720 


40 


TACGTTAGAA 


GATGTGCAAA 


ATAAAAATGT 


GCCACCAACG 


TATTCTTTTA AAGATTTAAA 


780 




TGAAGCAATA 


GCTGAATTAG 


AAAAATAGAT 


ATAGTCATTT 


TATAAAGTAG 


GTGAATTGAT 


840 


45 


TTGGTAAAAA 


TAGTTGTTTC 


GAGGAAAATT 


CCAGATAAAT 


TTTATCAACA 


ATTAAGTAAA 


. 900 


CTTGGTGACG 


TTGTTATGTG 


GCAAAAATCA 


TTAGTGCCTA 


TGCCTAAAGA 


TCAATTTGTG 


960 




ACaGCcTTCG 


TGACGCAGAT 


GCTTGTTTTA 


TTACATTAAG 


TGAACAGATC 


GATGCAGAAA 


1020 


50 


TTTTAGCGCA 


ATCACCAAAT 


TTAAAAgTAA 


TTGCGAATAT 


GGCTGTAGGA 


TA 


1072 



(2) INFORMATION FOR SEQ ID NO: 436: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3271 base pairs 
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CO STRAND EDNESS : double 
(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 436: 

TAAAAACTTA CTTTAACACC ATTCCTTTTT AACTTTTTTC GTGTTTCnTT TnCTTAAGTC 60 

10 CATC CAT ATT TTTAATGATG TCATCTGCTG TTTTATCTTT TAAATCTAAC ACTGaGTGAT 120 

AmCGAATTTG TAGCACAGGA TCAAATCCTT TATGGAATCC AGTATGTTCA AATCCTAAGT 180 

TACTCATTTT ATCAAAGAAC CAATCATTAC CAGCATTACC TGTAATCTOG CCATCATGAT 240 

TCAAGTATTG ATATGGTAAA TATGGATCGA TATGTAGGTA TAGACAACGA TGTTTTTTAA 300 

CATATTTTGA TAATTCATTA AAGAAAAAGT GTACGAGTTC TTGATTTTCA TAATCAATCA 360 

CTGGACCGCG ATTTGAATAA AAATACTTGA ACACTTTCAT AACAGGTACA GCAGTAAGtA 420 

AGCAAGCTGC AATGACCTCG TTATTATTGT TTTTTATTCC CACTAAATGT GTTTCATAAC 4 80 

CTTCAGCAAG CTTTAACTCA TAGTGGCCAA CAGTTTGCGT GaAATGACTG TATGGCATGC 540 

TATCTGTAAa GGCACCAAAC TCTTTAGCTG TTAAATTTGT AAACTTCATT ATCATTACTC 600 

CTATTTGTCT CTCGTTAATT AATTTCATTT CCGTATTTGc AGTTTTTCTA TTTCCCCTCT 660 

GCAAATGgCA AAAATAATAA ATCTAATCTA AATAAGTATA CAATAGTTAA TGTTAAAACT 720 

30 AAAACATAAA CGCTTTAATT GCGTATACTT TTATAGTAAT ATTTAGATTT TTGAATACAA 780 

TTTCAAAAAA AGTAATATGA ACGTTTGGGT TTGCTCATAT TACTTTTTTT GAAATTGTAT 840 

TCAATTTTAT AATTCACCGT TTTTCACTTT TTCAAACAGT ATTCGCCTAA TTTTTtTAAA 900 

TCAAGTAAAC TTAATTATTC AATGTTTGTT GGATAGATTG TAAATATTTA ATGATTTCCT 960 

CACGCGTGTT AGATTTAAAT CGCTTAACGA TTTCGCTACC AATGACAATG CCATCTGCAA 1020 

CCTCTTTTAT ATCTGCAACA TGTTGTGGTG TTCTTATACC AAATCCTGCG ACAACTGGCA 1080 

CATTGGCTAT CGCTTTAATT GACTCAATTT TTCGTTTTAA TTCTGGATGA AACGCACCGT 114 0 

TTTGCCCTGT TGTCGCATTC ATCGTCACAG TATAAATAAA GCCTTCCGCA TGGGATACGA 1200 

4S TATCTTTTAT ACGTTTGTCA TCAGTAGTCA TCGCAACTAA CGATATGATT TTGACGCCAT 1260 

AGTGACTAAA TTGTTGTTTT AAACGCTGCG ATAATTCATA TGGTAAATCA GGAATAATTA 1320 

AGCCGTAGAC ACCAGTATCT CGACATTTTT CAAAAAACGC TTGTTCTCCA TAATGACAAA 1380 

SO TAATATTATA ATACGTCATT AATACATAGT TACACTTAAT TTGATCACCA TGTTTTTCTA 1440 

ATTGATTGAA AATATAATCT ATCGTGATGC CTTGTTTAAT CGCTTGTTGA CCTGCTTCCA 1500 

TGATAACTGG ACCATCAGCA ACCGGATCAG AGAAAGGTAC TCCAATTTCA ATTATATCTG 1560 
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GTATAAATAA TTTAGTCATT TGCAAGACCT 
ATATCTTTAT CGCCACGTCC AGAAATAGTT 
5 GGCGCTAGTC TTTCAACATA ACTCAGTGCA 

TCATGTTTTG TAAAGTTGAT TAAAGCATTC 
GTTACTCTAC CAATGTCGTG GTAATAAGAA 

10 

CCTGCTGAAA TAGAATGTGC TAGTTGCACT 
TTAGTACCAT GTAATACGCC AGGTGATCCT 

15 TCATCGCCTT GACCTGCGGC TTCAACACCG 
TAAAATGTAC CGATTGCATT TGAGCCACCA 
CGACCTTCTT TCTTCAATAT CTGTGATTTT 

20 CTAACAATCG TTGGGAACGG GTCTGGACCT 
TCTACATGAC TTACCCAATA TTGCAATGCT 

CCATCTTCAA CTGCCACAAC CTTTGCACCA 

25 

TGTCTTTTAA TATCTTCACT TCCCATAAAG 

ACCGTAGCAC TAGCTACACC ATGTTGACCC 

CCCATTCTTT TAGCAAGCAA CGCTTGACCT 

30 

TGATTTAGAT CCTCTCGTTT CAAATATATT 
GCAGCATATG TAAGTGGTGT CGCGCGTCCT 

35 CTTTGAAACT CTGGGTCTGC TTTTGCCTCT 
GGCATTAATG TTTCTGGAAC ATATTGCCCT 
GCTTCTGTTT GTATTTGTTT ATTCATTGTC 

40 TGTCATTTTT TCTATATCTT TTCGCCCATT 
TTGATGTGAT AATTTAAGTT GATTAACTGT 
TATCAAATAA GGTATGTCTT TTATGTGCTT 

45 

ACCACCATAC GACACTGAGG GTGTGTCGAT 
ATTTATGTTT TGGATTATGT TTTCATCTnG 
ATATkTCTTT TTAATTTCCT GTAtAAAAtC 

50 

wTGaCGwATg CtTAAwACgT GTGCCAATGG 
(2) INFORMATION FOR SEQ ID NO: 4: 

55 



CGCTCTACCA TATATTGTCT AATTGTTTCC 1680 

ACTACAATAA TATCTTCTTT CGACATCGTA 1740 

TGTGCACTTT CAATTGCAGG TATAATACCT 1800 

ATTGCTTGTG TATCACTAGC ATTTTCAAAA 1860 

TGTTCTGGTC CAATACCAGG ATAATCAAGT 1920 

TGCCCATCTT CATCTTGAAT TAAATACATT 1980 

TTGCCAATTG CAAGTGCATG TTTATCAGTA 2040 

TATAATGCAA CATCATCTTT AATAAATGGA 2100 

CCGATACATG CTACAATTGC ATCCGGAAGT 2160 

ATTTCTTTAC CAATCACACT CTGAAAATCT 2220 

AATGCAGAAC CTAATAAATA ATGTGTATCA 2280 

TTATTAACTG CATCCGATAA AGTCCCTTGA 2340 

AGTAATTCCA TTCTAAATAC ATTAAGTTGT 24 00 

ACAACAAGTT CCATATCAAA TAATGCAGCA 24 60 

GCACCAGTTT CAGCAACAAG CTTCTTCTTG 2520 

AACGCATTAT TAATTTTATG GGCGCCTGTA 2580 

TTAGCGCCAC CTAGGCTTTC AGTATATGAT 2640 

ACATACTCTG ATAAATAGTA TTCCAGTTCT 2700 

TTATAAGCTT TTTTCAACTC AATAATTGCT 2760 

CCATATTCAC CAAAGAAACC TAATTCATCT 2820 

TCTATCTCCT TTCACAATAT TTACAATTGC 2880 

TACTTCTATA CCTGATGCAA GATCATAACC 2940 

TTGAATATTT TCAGAGTTAA TGCCTCCTGC 3000 

CAAAATAGTC CAGTCATATG TTTGACCGGT 3060 

AATAAATAAA TCTACGAACC CTTTATATTT 3120 

CAGtAAAGCT TTAGTGATTT TAATGCTTGA 3180 

AATAGATTCt GtGTAACTGT ATTGTGkTAA 3240 

T 3271 
17: 
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(A) LENGTH: 1553 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS :. double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: ! 
10 ATAATGAAAT AATACTGTGT TTTATCTGCG 
AAAATGAAAA GATAAAGTGT GTTTTTACTT 
TAATTGAGCT ATGCTTATTA TTACAATTTG 

15 

ATAATATTAA ATAAAGAAAC TTACACAAGC 
AAATCAAAGT TGAAAGCTAC AAATAATGAA 
TATAATTATG ACAATGTTAA CTTTTAAACG 

20 

TCTAATTTAT TCAAGTACTT TCGCAAGATT 
GAGTtCACAA AAAAgAAAAT TAGTCTTTTT 

2$ ACCTTGAAGA CGTATTTTTC TTATTATGTT 

CAAAACTTAA TATTATTGAT GAATCCTTAT 
CTATTCTTTA AAGGCAAAAA AGCATTTTGG 

30 TTCCTATTAT ATGCCAATGT TGTGTACTTT 

ACTTTAAACC AAGTAGGTAA CGTAGAATCT 
TGGTATGACT TTGTTTATTT CATTGATACG 

35 ACAAAATGGT TAGACACAAA AGCATTTAGT 

TCAGTAGCAT TATTCTTCTT AAACTTAGCT 
ACACGTACAT TTGACCATAA ATATTTAGTG 

40 

TACGaTGGTG TTAAAACTAT CGAAAATAAT 
TTAACaAAAG TATTAAAtTA TACGAAAcAA 

l 45 GGGGTGGcAA rGAAGAAAAA TATTATTArG 

ATTAATAAAA AGGTTAATGG TAAAGAAgTA 
AAAGAGCAAT TCACATACTT CCCTAACTTT 

SO GACTCTGAAT TTACAATGGA TAACAGTTTA 

TtaaaaGGAG ATAATACGTA TCAGTCATTA 
AAATCTGATG TCATGCACGG TGACTATAAA 

55 



!EQ ID NO: 437: 

AAATGTAtCA TTTTCTAATc GTTTCACAGT 60 

GAATTTTGAC TAAAATTACT CTATATTTAT 120 

ATTACAAATT TTAAATTTGT TAATTGAATG 180 

AAATATGAGT TGTAGCCCAA AATACTTGTT 240 

AATTATAAAC TTGAATCTGA AAGTAATTAC 300 

CACTTATTAA TTAACTACAT AATGTTAATA 360 

TATTATCTAA ATAACGGGGG AAAGAATCAT 420 

GCGTTCTTCT TATTAACCGT AATAACGATT 480 

GATTTTTCTT TAGGTGTTAA AGGTTTAGTA 540 

AGTTTAGTAG CACTGGTTTT AAGTGTGTTC 600 

TTCATGTTCA TAGGCGGCTT CTTATTGACG 660 

AGATTCTTCT CTGATTTTTT AACGTTTAGT 720 

ATGGGTGGTG CGGTTAGTGC ATCATTCAAA 780 

TTAGTTTACT TATTCATTTT AATATTTAAA 840 

AAGAAATTTG TTCCTGTCGT AATGGCGGCT 900 

TTTGCTGAAA CTGACAGACC AGAATTATTA 960 

AAATATTTAG GACCTTATAA CTTTACAGTA 1020 

CAACAAAAAg CGCTAgCATC TGAAGATGAC 1080 

CGTCaAACmG AGCCTAACCC rGAwTATTAT 114 0 

ATTCATTTAG AAAGTTTCCA AACCTTCTTA 1200 

ACACCGTTTT TAAACAAATT ATCAAGTGGG 1260 

TtCCATCAAA CAGGTCAAGG TAAAACATCT 1320 

TACGGTTTAC CGCAAGgTTC TGCCTTTTCA 1380 

CCAGCAATTT TAGATCAAAA GCAAGGCTAC 144 0 

ACATTCTGGA ACAGAGACCA AGTATATAAA 1500 
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(2) INFORMATION FOR SEQ ID NO: 438: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1419 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



10 

ixi) SEQUENCE DESCRIPTION: SEQ ID NO: 438: 



15 



25 



30 



35 



50 



ACAAAATCAA 


TCAGCAAAAT 


GATTGGATTA 


AGACGCAAAT 


TGAGCGTTCA 


ATGGAAGGCG 


60 


AAACAGTTGG 


CATTAATGAT 


CAAAATATAG 


AAATATATAG 


TGAAcGtTgA 


GATTTATACC 


120 


ATACACTCGT 


ACCTTTAAAT 


CAAGAATTGC 


ATAAGTTGCG 


ACTTAAAACT 


CAAAACTTAA 


160 


CCAATGAAAA 


TTATAATATT 


AATGATGTGA 


AAGTTAAAAA 


GATTATTGAA 


GATGAACGTC 


240 


AAAGACTAGC 


ACGAGAACTT 


CACGATTCTG 


TTAGTCAGCA 


ACTTTTTGCG 


GCmAGTATGA 


300 


TGCTATCTGC 


TATCAAAGAA 


ACGAAtTAGA 


ACCACCATTA 


GACCAACAAA 


TTCCTATTTT 


360 


AGAGAAAATG 


GTTCAAGATT 


CGCAGTTAGA 


AATGCGTGCT 


TTGCTGTTAC 


ATTTAAGACC 


420 


GCTTGGTTTA 


AAAGACAAAT 


CTTTAGGTGA 


GGGTATTAAA 


GATTTAGTTA 


TTGATTTACA 


480 


AAAAAAAGTG 


CCAATGAAAG 


TTGTGCATGA 


AATACAAGAT 


TTTAAAGTGC 


CTAAAGGTAT 


540 


TGAAGATCAT 


TTGTTCAGAA 


TTACACAGGA 


AGCAATTTCG 


AATACATTGC 


GTCATTCAAA 


600 


CGGTACAAAA 


GTGACAGTAG 


AATTGTTTAA 


TAAAGACGAT 


TATTTATTGT 


TGAGAATTCA 


660 


AGATAATGGT 


AAAGGTTTTA 


ATGTTGATGA 


AAAATTAGAA 


CAAAGTTATG 


GACTTAAAAA 


720 


TATGCGTGAA 


AGAGCTTTGG 


AAATTGGTGC 


AACGTTCCAT 


ATTGTATCAT 


TGCCAGATTC 


780 


AGGTACACGT 


ATCGAGGTGA 


AAGCACCTTT 


AAATAAGGAG 


GATTCGTATG 


ACGATTAAAG 


840 


TATTGTTTGT 


GGATGATCAT 


GAAATGGTAC 


GTATAGGAAT 


TTCAAGTTAT 


CTATCAACGC 


900 


AAAGTGATAT 


TGAAGTAGTT 


GGTGAAGGCG 


CTTCTGGTAA 


AGAAGCAATT 


GCCAAAGCCC 


960 


ATGAGTTGAA 


GCCAGATTTA 


ATTTTAATGG 


ATTTACTTAT 


GGATGACATG 


GATGGTGTAG 


1020 


AAGCGACGAC 


TCAGATTAAA 


AAAGATTTAC 


CGCAAATTAA 


AGTATTAATG 


TTAACTAGTT 


1080 


TTATTGAAGA 


TAAAGAGGTA 


TATCGTGCAT 


TAGATGCAGG 


TGTCGATAGT 


TACATTTTAA 


1140 


AAACAACAAG 


TGCAAAAGAT 


ATCGCCGATG 


CAGTTCGTAA 


AacTTCTAGA 


GGAGAATCTG 


1200 


TTTTTGAACC 


GG AAGTTTTA 


GTGAAAATGC 


GTAACCGTAT 


GAAAAAGCGC 


GCAGAGTTAT 


1260 


ATGAAATGCT 


TACAGAACGA 


GAAATGGAAA 


TATTATTATT 


GATTGCGAAA 


GGTTACTCAA 


1320 


ATCAAGAAAT 


TGCTAGTGCA 


TCGCATATTA 


CTATTAAAAC 


GGTTAAGACA 


CATGTGAGTA 


1380 



55 
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(2) INFORMATION FOR SEQ ID NO: 439: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 608 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



10 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 439: 

ATGTnGGCGG ACGTAAAGGA CATGTTTATA CTGATGATCG AGCATTAGAT ATTGATATCG 60 

\ 

j5 TTCCGCCTGC TCAAGCAGAT GGTAAAGCTA CTAACCCCGA ACAATTATTT GCAGCAGGTT 120 

ATGCATCTTG CTTCAACGGT GCTTTCGACC TAATTTTAAA GCAAAACAAA GTGCGTGATG 180 

CTCATCCAGA AGTAACACTA ACAGTGAGAC TAGAAGATGA TTCAGACTCA GAAAGTCCTA 24 0 

20 AATTAAGTGT TTCAATTGAT GCGACAATTA AAAATGTTAT ATCTCAAGAA GAAGCTGAAA 300 

AATATTTACA AATGGCTCAT GAATTTTGTC CATATTCAAA AGCGACTCAA GGAAATATTA 360 

ATGTCGATTT AAATGTAAAT GTTGTAGATT AGCATTAACT TAAAGAGATT ATTCAACGTT 420 

25 ATTAATAAAA TTCACATAAA ATTCAAATTt StCrAcCAAA AATTTTTGGT TGGyTATTTT 4 80 

TTCTATTCGT GATTGAAATT TCTGGCAATA TTTAACTGAA AATGATTGTA CCTTAGTCAT 54 0 

CATAAATGTG ACCGGTTCCA ATACTGGCTT GACTTCTTCG CATACCGTCT ACAAATAAAA 600 

30 

GTCCAGTG 60 8 

(2) INFORMATION FOR SEQ ID NO: 440: 

(i) SEQUENCE CHARACTERISTICS : 
35 (A) LENGTH: 682 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS: double 
(D) TOPOLOGY: linear 

40 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 440: 
CCTTTCAAtT TCTCCCAAgA TTTACGCATG TCTGACCAAA TGTCAATACA ATACCTGAAT 60 
45 AATGATTTCT GGAGTAATTG CGAAAAATAT TTAAAAGTTG CTATAGATCA ATTTTCAAAT 120 

TATAGTATCT CATCTCAAGT TTCTAACTAT CATTTCACAG TATTACTTGG AGATCGCCAA 180 
AAACCACTTA TGTATCTAAA TAAAAATCGC GGTGGTGATG GTGGCATACC AGGTTATATT 240 

SO 

ATGATTTATT TAGTGCCGAG TACAAGTACA ATTAATTCTA TGAAAAGCTT AATTGCACAT 300 - 

GAAGTAAATC ATAATATGCG CTATCAATAT ATTGATTGGG ATGGCGGAAG TTTGATTGAA 360 

55 
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10 



15 



ATTGGACCGT GGGTAACAAA TACTAATTGA AGTCGTGATA ACGTAAAAAT TAAAAATACT 480 

ATTTATAATC ATTTACATTT AAAGCATATA TTTGAATCGA tGCCTTATCT CTATGGTGAT 54 0 

GATATTAATA AACTTCAAGG TAGGCCTATC GTTGGCTTAT CTCATGCTGC CGGGTATGCA 600 

TGTGGCTATC ACTTGGTAAA ATACTTTTTA CAAAAAACAA ACATACCTAT TGAAGTTGCT 660 

ACAACACTTC CAGCACAAAA AA 682 
£2) INFORMATION FOR SEQ ID NO: 441: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2574 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



25 



30 



35 



20 <xi) SEQUENCE DESCRIPTION: SEQ ID NO: 441: 

ATCTTCTTTT AACATGACAA ATTGCAACAA AATATTAATG ACGCCAAAAG ACATTTTTTC 60 

ACGTTCAATT AATTCTTCAA CCATTGTCTT TTGCGATATA GTTGGTTCTG ATTCAGACCA 120 

AGAAGCTAAC ATATCAATTG GACTCGTTTG TTCAAGTAAC TCAAACCATT CATCACTTTG 130 

TGGCTTTGGA TTCACTTCTG AAGATTTGCC CGCCGAAGAT GATGTAGCAG GAGATTTCAC 240 

CTGTAATTTA GGCATTTGAT TTTCGTGTTC CATTAAGTAA TACGAGCGTG CTTGTTTACG 300 

CATTTCTTCA AAGGATAACT GTTGTCCACT TGTAATTGAA TTTAAAATAA CATGCTTCAT 36 0 

GCCATCTGCT GTTAAACCAT ATAAAGTCGC GAGTTGTGTA ATTAAACGCT TTGCATCTTT 420 

GGTAACAATG TCTTGACTAA TAAAATGTTT ACCTAACATT TGTCTCAACA TTTCAAAGTC 480 

AAAAGATTCA TTTGATAAAT CGATACCTTG GTACGGTTCA TTAATCGGaA TATCACTTGT 540 

ATCGATATCT ATTTTTGTAG ACGGCACTTT AAAAACATCA GTAAATTGTC TTGTTACCTG 600 

40 TTTAAATTCA CTCAAATCAA TTTGTTGATA CTCAAAGTAT TTCTTCAACT CATGAAATCG 660 

ACGATGCTCG ACTTCACTAT ATAAAAAGAT TGACAACATT GGATCATTAA AAAATAAATG 720 

TGCTGAAGGG GtTGaATTAA TTGGTAAACA AATTGTGTTT CTTGTTCATC ATGTTTGACA 780 

AACGCCTTTA ACAATCCAAT CGCTTCAAGT AAGTCCATTT GTTGTCTAAA CTCTAGTAAA 84 0 

TTAATTTTAA GTTCATTCAT AAAAATATAA TGAGAAAGAA TCAATGTTTC ATTATGACTT 900 

TCTTTAACGA ATTGAGTCAT AAAATGATAT AAACCCACTG CTTGCGTTCC AATTAGCGGT 960 

GTATACAGTC GATTCAATAC CTCTAAATGA TTCGTATTTA AATCAAAGTG TTGCATAACT 1020 

TTGAATTGAT CCTTTGGTCT TAAGCCGAAT TCGAAGGCTT GTCGTCCCaT TTAAGCnATC 1080 

55 
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40 



AAATTCTTTA 


TAGACTGATG 


CAAATCTAAC 


ATATGAAACT 


TGATCAACAT 


GCATTAACAA 


1200 


GTTCATAACG 


TGTTCACCTA TATCTCGTGA AGACACTTCC 


GTATGACCTT 


CATCTCGTAA 


1260 


TTGCCATTCA ACCTTGTTAG 


TTATGTCTTC 


AAGTTGTTGA 


TATCTAACTG 


GTCGTTTCTC 


1320 


ACAAGAACGC 


ACAAGTCCAT TAAGTATCTT 


TTCTCTTGAA 


AACTGCTCTC 


TTGTGCCATC 


1380 


TTTTTTCACA ACTATAAGCT GACTAACTTC GATATGTTCA 


AATGTAGTGA 


AACGTGTTCC 


1440 


A PA A TTTTO A 


CATTCTCTTC 


GTCTTCGAAT 


GGCATTTAAT 


TCATCGGCAT 


GCCTTGAATC 


1500 


TAP A At "i y i w i'A 


GATTGTGTAG 


AATTACATTT 


CGGGCATTTC 


ATTACATCAC 


CCTCTTTATT 


1560 




CTAATTATAC 


TATAAATCTA 


GAGATGAAAA 


AAGAATCCCT 


CAATTTAATT 


1620 


PATTTAAPPA 


AATAATGAAA 


CAATAAAAAA 


CATTATATCG 


TTACTTATTA 


AGTAATTTGC 


1680 


ATfSAPAATAT 


TATTGTATTA AAAATAAAAA 


ACCTAACTCC 


GAAGTCAGAG 


TTAGGCTATA 


1740 




ATTAACTTGC 


ACTTACAGTT 


TCTTTTGATG 


TCAAAAGTGC 


TCCAATTTGC 


1800 


TCAGCAACAT 


CTACAACTCT 


ATTTGAATAA 


CCCCATTCAT 


TATCATACCA 


AGCAATAACT 


1860 


TTTACTTTAT 


TCCCTGACAT 


GACCATTGTT 


GATTTTGCAT 


CAATAATAGC 


TGAATTTGGA 


1920 


TTAGTATTAA 


AATCAACAGA 


CACTAGTGGT 


TGATGTTCGA 


CTTCTATGAT 


ACCTTCTAAA 


1980 


CCTGCATTTT 


CAAAAGCTTG 


GTTTACTTCT 


TCTGCAGTTA 


CTTCTTTTTC 


TAAATCAACA 


2040 


ACTAAATCAA ■ 


CGAGCGATAC 


ATTCTTTGTT 


GGTACACGTA 


ATGCCATGCC 


GTGTAATTTA 


2100 


CCTTCTAATT 


CTGGTAATAC 


TTCTTTTAAA 


GCTTTCGCCG 


CACCAGTAGA 


AGTAGGAATA 


2160 


ATGCTTTCAT 


TACATGAACG 


TGCACGTCTT 


AAATCTTTAT 


GTGGATTATC 


AATATTTTTT 


2220 


TGGTCATTTG 


TAATAGCGTG 


AACAGTAGTC 


ATTAAACCAT 


TAACTATTCC 


AAACTGATTA 


2280 


TTTAAAACTT 


TTGCAACTGG 


ACCAATGCAA 


TTAGTAGTAC 


ATGAAGCATT 


ACTAAAAATG 


2340 


TCAAATGCTT CTATATCTAA TTGGTTATCA TTTACGCCTT 


TAACTACCAT 


TTGAACATGT 


2400 


CCACCTTTTG 


nAGGACCAGT 


TAACAAAAsT 


TTTtTGGCAC 


CTGCTTTAAT 


ATGTGCGATG 


2460 


GCTTTATCAC 


CATGaTTAAA 


TTTACcAGTT 


GCATCTATAG 


CAATATCGAT 


ATCTAATTCT 


2520 


TTCCATGGCA 


AGTTTTCAGG 


ATTGCGATCA 


GCAACCAATT 


TAATTTTATG 


ATCT 


2574 



45 (2) INFORMATION FOR SEQ ID NO: 442: 

(i) SEQUENCE CHARACTERISTICS: 

(A/ LENGTH: 3326 base pairs 
<B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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CAAGGTACCG GTTTAGGTTT GTTCATTTGT AAAATGATTA TCGAAGAGCA TGGTGGTTCC 60 

ATAGATGTTA AAAGCGAATT AGGGAAAGGC ACAACATTTA TTATTAAACT ACCAAAACCA 12 0 

GAATAAAATT GAATATAGTT ATTTCAGAAC GCATGTTATT GATTAGAGAC TCTAATTTAT 180 

AGCATGCGTT TTTTGATTGA TGTGGGGAAT TTTGTATGTG GATTAGAACT TAGGGTTTTT 24 0 

GCGAATATCA ACTATTAAAT ATATTACTAA TTTATACAAA AATATAAAGT TTGATAAAGT 300 

TATTTATTTG ATTATAAAAA TAGGGTAAAA TATAGATATA TTGTATTAAT TAAATTATTC 360 

GAGGTGTCAT ATGAAAAAAT TCATTGGATC AGTTTTAGCT ACGACATTAA TTTTAGGGGG 420 

ATGTTCCACG ATGGAAAATG AATCAAAAAA AGACACAAAA ACAGAAACAA AATCTGTACC 480 

AGAAGAAATG GAAGCTTCAA AATATGTAGG CCAAGGCTTC CAACCGCCTG CAGAAAAAAA 540 

TGCGATTGAA TTTGCGAAGA AGCATCGTAA AGAATTTGAA AAAGTAGGTG AACAATTCTT 600 

20 TAAAGATAAC TTTGGACTAA AAGTTAAAGC TACAAATGTT GTAGGTAAAG ATGATGGTGT 660 

AGAAGTTTAT GTGCATTGTG AAGATCATGG CATTGTATTT AATGCAAGTC TACCTTTGTA 720 

CAAAGATGCC ATCCATCAAA AAGGATCAAT GCGCAGTAAT GACAATGGTg ATGATATGAG 780 

TATGATGGTG GGTACAGTGC TGAGTGGCTT TGAATATCGA GCGCAAAAAG AAAAGTATGA 840 

TAACTTATAT AAATTCTTCA AAGAAAATGA AAAGAAATAT CAATATACAG GCTTTACAAA 900 

AGAGGCAATT AACAAGACAC AAAATGTCGG ATATAAAAAT GAATATTTTT ATATTACATA 960 

CTCTTCTAGA AGTTTAAAAG AATATCGAAA GTATTATGAA CCACTGATTC GAAAAAATGA 1020 

TAAAGAATTT AAAGAAGGAA TGGAACGAGC AAGAAAAGAA GTGAATTACG CTGCAAATAC 1080 

35 AGATGCTGTT GCTACACTTT TTTCTACTAA GAAAAACTTT ACTAAAGACA ATACAGTAGA 1140 

TGATGTAATC GAACTAAGTG ATAAATTATA TAATTTAAAA AATAAACCAG ATAAATCTAC 1200 

AATCACAATA CAAATAGGGA AACCCACTAT TAATACTAAG AAAGCCTTTT ATGATGATAA 1260 

40 

TCGTCCAATA GAATATGGGG TGCACAGTAA AGATGAATAA AATTAATGAT AGGGATTTAA 1320 

CAGAATTAAG TAGTTACTGG GTTTATCAAA ATATTGATAT AAAAAAAGAA TTTAAAGTTA 1380 

ATGGAAAAAG GTTTAAACAA GTAGACAGTT ATAATGATGA TAAGAATAGT AATTTGAATG 144 0 

45 

GTGCTGCTGA TATTAAAATA TATGAGTTAT TAGATGATAA AAGTAAACCA ACTGGTCAAC 1500 

AGACAATAAT TTATCAAGGA ACATCTAATG AGGCAATTAA TCCAAATAAT CCATTAAAAT 1560 

so CATCGGGGTT TGGAGATGAT TGGCTCCAAA ATGCTAAATT AATGAATAAT GATAATGAAA 1620 

GCACA.GATTA TTTAAAGCAA ACAGATCAAT TATCAAATCA ATATAAAATA AAGTTAGAAG 16 80 

ATGCAGATAG ATTATCAAAT AGTGATTTTT TAAAAAAATA TAGAATGGAA TCAAGTAACT 1740 

55 
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ATCAAGGAGC 


GAAACATCCG 


AATGAAAAAG 


TTGTTGCTAC 


TGACTCAGCA ATGATTCCTT 


1860 


ATGCTGCTTG 


GCAGAAATTT 


GCTAGACCAC 


GCTTTGaTAA 


TATGATTAGT TTTAATAGTA 


1920 


CCAACGATTT 


ATTAACATGG 


TTACAAGATC 


CATTCaTCAA 


AGATATGCCA GGAAAACGCG 


I960 


TTAACATTAA 


TGATGGTGTG 


CCCAGGTTAG 


ATACTTTAAT 


AGACAGCCAT GTAGGTTATA 


2040 


AAAGGAAGTT 


AAATAGAAAA 


GATAACACAT 


ACGATACTGT 


ACCACTAATC AAAATAAAGT 


2100 


CGGTAAAAGA 


TACAGAAATT 


AAAAATGGAA 


AAAAAGTAAA AAAGACTATT AACATAACAT 


2160 


TAGATATGGA 


TGGGCGAATT 


CCAATAAATG 


TTTGGACAGG 


AGATTCGATT GCACGTTCTG 


2220 


GAAGAGGAAC 


TTTAATTAAA 


CTTAATTTAG 


AAAATCTTGA 


TGCGTTGAGT AAACTGATTA 


2280 


CTGGTGAAAC 


AAGTGGTATG 


TTAGCAGAAT 


GCGTAATCTT 


TTTAAATGAA AGTTTTAACA 


2340 


TCTCAGAAAA 


TGAAAATAAA 


AATTTTGCAG 


ATAGAAAGAa 


ACAATTATCA GAAGGATTTA 


2400 


AGGATAAGAT 


TAACTTATTT 


CAGTTAGAAG 


AAATGGAAAG 


AACTTTAATT AGTAAAATAA 


2460 


ACTCACTTGA 


AGAAGTTGCA 


GATGAAACAA 


TAGAAAGTAT 


TAGTGCTGTT AAACACTTAT 


2520 


TACCTGATTT 


TGCATTGGAT 


GCATTAAAAG 


AAAGAATTAA 


TGAGTTGTTT AAAGGTATAA 


2580 


AATCTTTTAT 


AGAAAAAGTG 


TATGATAGTA 


TAGATAATGA AATTTTAGAA ATTTTCAAAA 


2640 


ATATAGATCA 


CGACTTCAGA 


GATGGAGTAT 


CTGAAGAAAT 


GATGAAACAT TTGAAAGTAG 


2700 


TGAAACAGAA 


TATAGACCAA 


ATAAAAAATC 


AAAATGATAT 


TTATGGTAGG CAAATTGCAG 


2760 


ATATTAGAAG 


TATTATGAAA 


CAACAAGATG 


CAACAATTTT 


AGATGGAAAT TTTCAAATTA 


2820 


ATTGTAGCGG 


CGAAAATATG 


GTACAGGGTC 


TAGTTATACC 


TTCTAATTAT TTAGGAAGAA 


2880 


AAATGAAAAT 


ATTAAAAGAC 


CATATCGATG 


ATGGTATTAA 


AAAAATAGCA GACTATGTTC 


2940 


AAGGTATATA 


TGATGAATAT 


GCATCGAAAA 


TTGTCGATGT 


AATAAAATAT TTGATTAATA 


3000 


CAATTCCCAA 


AATACGTAAG 


AATTTAAGAC 


ATGCAATTGA 


AATGTTAAAT GTAAAAAAGA 


3060 


AAGAATT'l"! " 1 ' 


\3 X \* i vXrt X X 




CTTGTAATTA 


TATTAAAACT AAATTAGAAG 


3120 


AATTAGATAA 


TACTTTAGGC 


AAATGGGAGC 


CTTTTCTTAA 


TGATTTAAAA GCAGTGTCAC 


3180 


CAATTTTAGA 


TAACCATTTA 


GATGATATTG 


TTAAGAACAT GAAGCCTTTG ATTGTACAAA 


3240 


TGAyATwTGA 


AC CAT CA CAT 


TATGaCGATA 


TGTTTAATTC 


aAGAAAAGCT TTAACGcCAG 


3300 


TGTTCTCAAG 


CGTTTTATAA 


AGGTTG 






3326 



(2) INFORMATION FOR SEQ ID NO: 443: 

50 

ii) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5301 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 443: 

ACCTATAGCT GGCCCGTCAA GTCCTGAATC ATATGTCGCT ATAAACCCAG TTGCATGCCC 60 

AGCAATCTCG GTTTCAATTT CAAAATCATG CTCTTTCAAA CGATCTATTA AAGTTCGAGA 120 

CGCAAATATT TCTTCATTAC CAAGTTCAGG ACGTTCATGA ATTCTATGAC TGATTTCGAT 180 

ATAACTATAT TTATTTGTTT CTATATAATC GAGAATTTGT TGTTTTTCAC TCATTTTTTA 240 

CTATCTCCCT TTTACCCTAC ACTCATTTTA ATCATCCACA ATATTTTGTT CTTTCAAAAT 300 

GAATTATTAC TTATTCTATC GGTTTTATCT CATGATGTCA TCTAGTTTTT CTTTATTTAC 360 

AAAATTTTCT AATAACTAAA aGCCTTTCAT AAATTTATAA AACAGTTTCA AATTGTAAAA 420 

CATAAGCCCT ATTGTTACAA TTTAAGTATT GTTAGAAACA CAACTTACAA CAAACTTAAG 480 

TTTTATAATG CAACAAATCA TAAGCGTTTT ATAGTTTTGA GTAGTTAATA GGAGGAAATT 540 

CAAAATGACA AAAATGAATG TTGAAAGTTT cAATTTAGAT CaTAcTAAGG TGGTTGCCCC 600 

ATTTATTAGA TTAGCGGGAA CGATGGAAGG ATTAAACGGA GATGTCATTC ACAAATACGA 660 

25 CATTCGTTTC AAACAACCAA ACAAAGAACA TATGGATATG cCCGGACTAC ATTCATTAGA 720 

ACATTTAATG GCTGAAAATA TTAGAAATCA TAGTGACAAA GTTGTTGATT TAAGTCCTAT 780 

GGGTTGCCAA ACTGGTTTCT ATGTATCATT TATTAATCAT GATAATTATG ATGATGTATT 840 

AAATATTGTT GAAGCAACTT TAAATGATGT GCTAAATGCT ACTGAAGTGC CTGCTTGTAA 900 

TGAAGTACAA TGTGGCTGGG CAGCAAGTCA TTCATTAGAA GGTGCTAAAA CTATCGCTCA 960 

AGCATTTCTA GACAAACGAA ACGAATGGCA TGATGTTTTC GGTACAGGAA AATAAATCTT 1020 

AGTCAATCAA GTTAATCAGA AAaGCAGTCG AACAATGATT TTACAATCGC CATTGTCCAA 1080 

CTGCTTTTTA TTATGCTTCA AAGTCAAAAA ATCGAACAAA TGAAAAAGTA AAATCTTTAA 1140 

40 CATTTGTCCG ATTTATTTGA GAACCACTAT AATTTCTTAA TTAGTCCCAT TAACACGAAC 1200 

TGCATAGGTA ACCTTAAATA TAGTTGCCAT GTTGGCAATT GTTTATCTCC TAAAGGTAAC 1260 

TTTTTAACTG CCATATAGAT ATTAGCTGGG AATACAGCTA GCAAGAATAG ATTGATTGTA 1320 

TTTTTCAAGC ATTGAGATGG TCTTTTAATT AAAAGTGCAA GTCCAAATAA TATCTCAAAG 1380 

ATTCCTGTAA CAAGAACCGC TGTTTTTCGA AGTGGCAAAC ATTTCGGTAT GATATTTCTA 1440 

AATTGTCGTT CTCGTGTAAA ATGCAATACA CCTATTACAC TAAAACCTAT TCCTAATAAA 1500 

TATCTTAGTA TGTTCAATCA GCTTCAACTC CTATTCTGTA ATGATTTTAT GAATTAATGT 156 0 

AGGCGATACA ACATGaTCAG CAATTGTTAT GCTTGAATCT AATTTTTTAA CAACATCGTC 1620 
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AATTTTTTTA TTTAAAACAA TACCAACCGC TAAATCAATA TCATCCTCTT TTGTTAAACG 1740 

TCCCGCTCCT AACATCATCG AAGCGACACC TATATCGTTA GAGACTAATT CAGTCACATA 1800 

ACCTGATTTT TTAGCTTTAT ATTCAATTTG ATATTGAGCT TGTGGCAAAC GCTCTGGATG 1860 

GTCAATAACA GTTTCGTCGC CACCTTGGTT TTTAATAAAT GTTTTGAATT TTTCTAATGC 1920 

TGCACCTGAA TTAATTGCCT CAATTAGCAA CGCTCTCGCT TCTTCAAGCG TTTCAGCTTT i960 

GTTTGCAAGT ACAACCATTT GAGAACCTAA TGTTAATACA AGTTCTGTTA AATCTTTCGG 204 0 

ACCTTGTCCT TTCAACGTAT CAATTGCTTC TTGTAACTCA AGCGCATTGC CAATCGCACG 2100 

TCCAAGTGGC TGATTCATAT CAGAAATAAT CGCCATCGTA TTACGTCCCA CATTATTACC 2160 

AATACGTACC ATTGCGTGCG CTAATGCTTC AGCATCTTCT AATGTTTTCA TAAATGCACC 2220 

GCTACCAGTT TTTACATCTA ATACAATTGC ATCTGCACCA GCAGCAATCT TTTTACTCAT ' 2280 

20 AATTGAAGAG GCAATTAATG GTATTGAATT GACAGTACCA GTAACATCCC TTAAGGCATA 2340 

TAATTTTTTG TCTGCAGGAG TTAAATTTCC TGATTGTCCT ACAACTGCCA CTTTATTTTC 2400 

ATTAACCAAT TTCACAAATG TTGCTTCATC TATTTCAACA TGAAAACCAT CAATTGCTTC 2460 

TAATTTATCA ATCGTACCAC CTGTATGACC TAATCCACGC CCACTCATTT TTGCAACAGG . 2520 

AACATCTACA GCTGCTACTA ATGGTGCTAA AACCAATGTA GTTGTATCTC CTACACCACC 2580 

TGTTGAGTGC TTATCTACTT TGACACCTTT AATATCACTC AAATCTATCA TATCACCAGA 2640 

ATTAACCATA GCCATCGTTA ATGCTGCACG CTCATCATCA TTCATATCTT GGAAATAAAT 2700 

CGCCATTGCT AAACTTGATG CTTGGTAATC AGGAATATCC CCTTTAACAT AGCCGCCAAT 2760 

AAAGAAATTA ATTTCTTCCG TTGTTAGTGT ATGACCGTCA CGCTTTTTCT CAATAATGTC 2820 

TATCATTCTC ATTTTTATCA TCCTTTTCTT AAAAAGCTTA GGACAAAGCA TCTGCGCTTT 2880 

CTCTAGTCCA TTTTTAAAAG CACAAGCGAA AATTATTATA GCAAGCTATC GATTTCATTT 2940 

40 TTAATATCAC AATTTCAATG CGATGTTATT ATTCTTAAAT AGATTGGTTA TAACGTTAAA 3000 

GTCCCTATTA AATTATCTTA GAATCATCAT GGCATTTATG ATGTCTTAAA GCTGATATCG 3060 

ACATACTTAT ATATGGTTAC GATGTCCCAT GCTTACATAT TTTTATAAAA TTAGTAATCT 3120 

GAATCTGCTT CTAAACCTTG CATAATTTGa ACGCCTGCGC TCGCACCAAT ACGTGTCGCA 3180 

CCTGCTTCAA CCATTTTATT GAAATCTTCT AAATTACGTA CGCCACCTGA TGCTTTTACT 3240 

TCTATATCAG CACCTACTGT ATCTTTCATT AATTTAACGT CTTCTGCAGT CGCACCGCCA 3300 

CCTGCAAAAC CTGTTGAAGT TTTAACGAAG TCCGCACCAG CCGCTTTTGT TAATTCACTC 3360 

GCTTTTACAA TTTCGTCATG GTCCAACAAT ACCGTCTCAA TAATCACTTT TACTGTGTGA 3420 
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TTTAATGCGC CGATGTTGAT GACCATGTCA ATTTCATCTG CACCATTTTG AATCGCATCT 354 0 

TCTGTTTCAA ATGCTTTCGT CGCAGTTGTC GATGCACCTA ATGGGAATCC TATTACCGTA 3600 

CAAACTAACA CCTCTGAATC AGCTAGTCGC TCTGCTGCAT ATTTAACATG CGTTGGATTC 3660 

ACACATACAG ATTTAAAATG GTATGCTTTC GCTTCATCGA TGATTTGATC GATTTGCGTA 3720 

CGTGTTGACT CAGGCTTCAA TAAAGTGTGA TCAATCAATT TTGCACTATT CATTTTCTAT 3780 

CTCCTCCTTT ATGGTTGATT ATAAAAATAC GGTTGTAAAT TAGTTGATTG AGCGTCAGGT 3840 

TCATTTAAAT ATCAGGTTAG ATGTTCGCTT TTTATGTAAC CGCATACATA TACTATTACA 3900 

TTAATTCATT TCCCATAAAC AAACAATACA ATTGAACGTG ATATCTTCAT TATGAACGAT 3960 

GACTTGACAA CAAGCTAATC AGGATTATAT TTTTATAATT CTTTAATTCT ATAGTACAAA 4 020 

AATTCGCAAA AAAGGGAAAC AAATGTTATC TTAAAATTAT TAATGAATAT TAAGGAGAAG 4080 

20 ATAACAAATG ACAAAAGGTA CACCACATAT TCAACCAAAT GGAGTAAAAA TTGCTAAAAC 414 0 

AGTATTAATG CCTGGCGATC CGCTACGTGC AAAATATATT GCTGATAATT TTTTAGAAAA 4200 

TGTTGAACAA TTTAACGATG TACGTAACAT GTTTGGTTAC ACTGGTACAT ATAAAGGTAA 4260 

25 AGAAGTTTCT GTAATGGGTT CTGGTATGGG TATTCCAAGT ATTGGTATTT ACTCATATGA 4320 

GTTATACAAC TTCTTTGATG TAGATACAAT CATTCGTATC GGTTCTTGTG GCGCATTACA 4380 

AGAAAATGTT AACTTATACG ATGTTATTAT TGCACAAGCT GCATCAACTA ATTCAAATTA 4440 

TGTAGATCAA TACAATATTC CAGGTCATTT CGCGCCTATC GCTGACTTCG AGTTAGTAAC 4500 

TAAAGCTAAA AATGTCGCTG ACCAAATCGG TGCTACTACA CACGTAGGTA ACGTATTATC 4560 

TTCTGATACA TTTTACAATG CCGATCCAAC ATTCAATGAT GCTTGGAAAA AAATGGGTAT 4620 

TTTAGGTATC GAAATGGAAT CAGCTGGTTT ATATTTAAAT GCGATTCATG CTGGTAAAAA 4680 

AGCACTTGGT ATTTTCACAG TAAGTGATCA TATTTTACGT GACGAAGCTA CTACACCTGA 4740 

40 AGAACGTCAA AATTCATTTA CACAAATGAT GGAAATCGCT TTAGAAATCG CAGAGTAACT 4800 

TATTTAAATT GACTTTAATT GCTCTTTAAC AATGCGATTA AACTCAAAAA GCCAACACAT 4860 

TCTGGGCGTA TCCCCATTTA TGTGTTGGCT TTTATTTATA TTATTACTTA TCTGTAGATT 4920 

AGCTTAAGTA AGATTTAAAC ATCCAATTAT GTTTATCTAC TGATGTTTGC ATACCTATAA 4980 

ACATATCTTC TGATACATCA TCGCCAGCAT TACCAGCAAT TTCGATTGCG TTTTCTAATT 5040 

GTTTTGAGAT ATTTGTGAAG TCTTGTGATA ATTCTTCAAC CATTTGTTCT GCAGAGTAAC 5100 

CTTTCGCAGC TTCTTTAACA ATTGATTGCT CTAAGCATTC AGTTAATGTA CCTACAGGGT 5160 

TTCCTCCTAC CGCTAAAATT CTTTCAGCTA ATTCGTCTAC ATATTGGCTT GCTTCATTAT 5220 
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AATTGTGTAG CTTTGTGTAA G 5301 
(2) INFORMATION FOR SEQ ID NO: 444: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 11466 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY : linear 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 444: 

GAAGATGAAA GCTATATTGA AGATGATGTT ACTAAAAAGG AAGCTATTTT AAGTATGCAA 60 

ATTCCTAAAG GTTTCTCTCA AAAATTAAAA GAGAACCGTT TAAAAGAAAC GATACAGTTA 120 

TATGGTAGAG ATGACTTTAT AGGTGGTATT GCTGTAGAAA TTGTTAGTAG TTCATTATAT 180 

20 GAGCAGCAAA TTCCTAACAT TATTTATGAA CACCTTGAGG ATATGAAACA GCATCAATCC 240 

ATCGATGCTA TCAACAAGTC CTATCATAAA CATACACCTG AATCTAAAAT CAAATTTGTG 3 00 

TCGCTTACTA AACAAGCACA ACACTCTATT TCAATTAGCT TAATCTTTGC GGTGATTTTA 360 

TTTGTTAGCG CTGTTCAAGT AGTACTTCAT TATCGTTTAA ACCAACAAGC AGCATTGCAA 420 

CGATTATCAC AATATCATTT AAGCCGTTTC AAACTATATA GTACTTATGT AATGACACAT 4 80 

ACGATTTTGT TATTGTTGGT ACTATTGGCA GTTAGTCTAT ATTTGTCTCA ACCACTCAGC 540 

TTAATATTTT ACTTAAAATC ACTGTTACTT ATATTGATTT ATGAGATAGG TATCGTCTTT 600 

ATCTTATTCC ATATTCAAAC AATAAGTCAT CGATTATTCA TGACATTTAT ATATGCACTT 660 

GCTATGGGTA TCGTATACTT GATTATTTTC ATGTAAAGGA GCGTAACTGA TGATAGAAAT 720 

TAATAACCTT TCAAAGCGTT ACCGTAACAA ACAGATTTTC AATCATTTAA CTATGTCCTT 780 

TGATAGTAAT CGTTTAACCG TATTACTTGG TGATAATGGT GCTGGAAAAT CAACATTACT 840 

40 TCGTATGATT GCTGGTATTG AAAAAGCTAA TGATGGAACT ATCAACTATT TCGGCGAAAA 900 

ATGGAATCAA AGACaAATAC aAAATCACAT CGGTTATGTG CCACAAGACA TTGCGTTATT 960 

TGAACACATG ACAGTGGCTG AAAACATTAA ATTTTTTAAA TCACTTTGTA AAAATCCAAT 1020 

TAACGATACA ACTATCAACG AATATTTACA GCAATTAAAC TTTGATGATA CGTCTGCCAA 1080 

AGTATCTACA TTGTCCGGTG GGAATAAACG TAAAATTAAT ATATTAGTAG GTTTACTAGG 1140 

TCAACCTCGA ATTCTCATTT TAGATGAACC GACAGTTGGT ATTGATTTAA AATCTAGACA 1200 

TGACATCCAC CAACTACTTA ACATCATGAA ATCTAAATGT TTAATTATAT TAACTACCCA 1260 

TCATTTAGAT GAAGTTGAAG CACTTGCAGA TGATATCAAG TTAATTGGCC AAGATCCTTT 1320 
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CCCAAGCTGC 


GTATGATATC 


GCAACTTGGG ATTTTCTGTA TTATCTACTT TGCAAGTATG 


1440 




ACGTTGGGTC 


TACTGCATAT 


TGATTACCGA TGCCACCAGA CATACGTTGG AAGTGTACGT 


1500 




GAGGCGCTGT 


TGAATTACCC 


GTACTACCTG AATATGCAAT TTGGTCACCA GCTTTGACTT 


1560 




TATCACCAGC 


TGAAACAGTT 


AAACGATTAT TATGCATATA CCATTGGTAG TTATTACTGT 


1620 


10 


TCGCTTCTTT 


AATCGTTACT 


TGATTGCCGC CACCATAGTT ACTCCAACCT GCTTGTACTA 


1680 


CTGTACCATC 


AGTTAATGAG 


TAAACTGGTG AATTTTCAGG CATTGCATAG TCGACACCGT 


1740 




AATGCGCACC 


ACCACCGTGA 


TATTGTCCAT ATGGTTGTAG TTGTTTACGA CTTGTTAACC 


1800 


15 


AGCTTGCGTC 


TTTCGCATGA 


CCACTAGcTG TCGCTTTACT TGCTGATCCA CCATTTTGAT 


1860 




TAGATGTGCC 


ATTAGGATAA 


TTGACCTTTC CATTACCATC ATGGCTGTTA TACGCTTGGT 


1920 




TGTTGTTACT ATGTGAATAA 


TAGCTCGCGT CTGGACCTAC ATTTGATTGA TAACCATATT 


1980 


20 


GATTAATATG 


CTGTTGGCTT. 


TGACTCGCTG TGTAGTCATT GTTATCTCCT GCTGTTGCTG 


2040 




GATTCACATA 


TGTTTGGCCG 


CTTCCATTGG CATTTGCATT TTTTGGATAA CAGTTATAAA 


2100 




AATAATGCGT 


ATGTCCTTGA 


GCATCTACGA ATGTATAGCT ATATTCTTTA TTATCAAACA 


2160 


do 


TTGCTTGATT 


CCAGTTACCA 


TCAGGTGTGT GATGATAATC CCCATTAGAA TCAATTGTAT 


2220 




AATAAGTACC 


ATAAGATACG 


TCTTGTGATT GTGTTGACAT TTGTGTATGT GCTTGTTGGG 


2280 


30 


TGTTTGTCGT 


TTCTGCTGCA 


TCTGCTTGAT GCGCCATTGT AAATGTAGCG AAsCCATCGT 


2340 


TGCAATCGCT 


GCTGCTGTTA 


ATTTTTTCAT GTATAAAACA TCCTCCATTA AAGTTAAAGT 


2400 




TAGTTTTCAA 


TTAAACTGTA 


CTGCACATAC TAAAAGAATT AGACAACTGA GTAAAGGATT 


2460 


35 


TAATTCTCAT 


TTTCCAACTA 


TTTAATATTC CCGAAATGTT TTACTAAACT CATTACATTG 


2520 




TCATTACAAA 


ATAGCCATAC 


ATTGATATTA AAATGACATC TCTCACTGCA TTCGTTTAAC 


2580 




CTTTTATAAA TTTTCAAAAT 


TAACAACTAA TCGTTCGTCC ATGTTCGCGA TTCAACGCTA 


2640 


40 


ATGCATGATA 


GTAATCATCC 


ATCAAATCAT ATCAACCAAA TTCCATTATC AATCGCTATT 


2700 




GATTGTCATT 


CAACTTTCTA 


ATAGTGATAT GCTTCTCAGG CTTAAAAATC GTCATATCTT 


2760 




TTCTATTAAT 


TAAATCATCT GTGAGCTTTA ATGCTACTAA TTCATTGCTG CCATAATACT 


2820 


45 


TAATATATAA 


CGTTCTTGTA 


GTTAAATTTA TTACGGTCTG ATACATCGTA TAGTGATTGT 


2880 




CAGCATCATG 


CGGACGTACA 


ATTCCAATCG GTATATTTAC CGCATCTAAT AAATAAAATG 


2940 


50 


CATTCATTAA 


ATCCATTTCT 


TTATCATTGT TTTGAGCAAT GTTTGCTTTC ATAAATGCCA 


3000 


TTCTCACAAA 


GCGCTCAGTT 


GAAGTAAATC CACCTGGCAA TCCAAATGTA CCTGCTTCAT 


3060 




TGCCTAAAGG 


TTCAATCGTT 


ACACCTTCCA ATAAATTTGC TGTTGCTGGA TAAGGAGAAA 


3120 
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CACCAATAGG ATTATCTTTT ATAACCACTT CACCCTCTTT AAATGAAACT TCGACTGTAT 3240 

GTCCAGTTGC ATCGGAAACA TGATAATGCA ATGGCGGAAC TTCACCGATG TCATTTAAAT 3300 

5 ATACAGCTAC AACATGTATT TGGGATGCTT GTTGTTTCAT ATCTTCAATG CTTGTTGTAT 3360 

ATCCCAAAAT CCATGTCACA ATTTCATTTT GCGTAATATT CATCGCGTCC GCTTTGTGTG 3420 

TTGATCCATA TGAACTATAA CCTCGGAAAT ATTGTGTTGA AATGGCAACG CcATGTtCAT 3480 

10 

TAACACCATC ACCATAAATA AAACCTTCCA TATCTGTTCC TGTGCCAATA AAGCCATATT 354 0 

GCGTTTGGCC TGTCGTGCCA GTGCAAGATT TCCAACGATA ATTTCTAGGC GTCACTGCTG 3600 

GCGAACCATC TAATGGATAA TCATAATCCA TCGTGCGTCC AAGAAGTACT TGATTATTTA 3660 

AAGTTTGTAT TGTGAATCCT GTGCACATTG TTCTCACTCC TCTGTACCTT CATTTACTTT 3720 

AATCACTTTC AAATAAAGCT GTTTCACTTA AACATACTAT AAAAAATCAA TTATACAAGC 3780 

20 AATTAATTGA TATTCATTCT CAATAACTGT GGTATGATAT GTAAGGAAAT CATGACTTAT 3840 

GTGTGAGTGA ACGATCATCT ATACATCCGT TCACTTCATC TCATGACTTT CTATATTTAA 3900 

TTTTTACAAG GAGTGACATC TGTGAATAAC ACACAATCTT CACCACGCAG TAATATTATT 3 960 

25 ATTGCGATTA TGTTGTCTGC ATTAACATAT TGGTTGTTTG CACAATCATT TATTAATATA 4020 

GGACCTCTCG TTGGTCAAAC ATATCAAACC TCTCCTGCCG TGTTAAATTT ATCTATTAGT 4080 

TTAACTTCCT TCGCCACAGG TATCTTCATG GTGGCTGCAG GTGATATTGC TGATAAAATA 414 0 

30 

GGACAACTGA GAATGACATA CATGGGTCTC ATAATCAGTA TGTTTGCATC TCTTCTATTA 4200 

ATTATATCGG ACATCACTGC ACTGCTCATC ATCGGTAGAA TTTTACAAGG TCTATCAGCA 4260 

35 GCTATCTTGT TACCTTCAAC AGTTGGCGTG TTAAATAATC AATTTAAAGG AGAACATTTA 4320 

AGACGAGCGA TTAGTTATCT AATGATTAGT ACTGTTGGTG GCATCGGCCT AGCTGGTGTT 4380 

ATCGGCGGTT TAATTGCCTC AAATTTCGGA TGGCAAACGA ATTTCATCAT TAGTATAGTC 4440 

40 ATTGCTTTCA TTGCCATATT GCTTCTAAAA GGCACACCTG AAAAAGTAAG TCAACATAGC 4500 

CACCGTCATC CATTCGATTA CAAAGGTATG TCGATTTTCG CTGTTATGAT TGGTAGCTTT 4560 

ACATTATTGT TAACACAAGG ATTCGAACAA GGTTGGTTTA GTACATTTTC AATCATTTGT 4620 

45 

CTGAGCATTT TTATCaTCAc TACGTTGATA TTCATCATCA TCGAACGTCG ACATGAAGTA 4680 

CCTTTTATTG ATTTCTCAGT ATTACGCAAC CGTCCGTTCA TTGGTGCATT TTTAAATAAC 4740 

TTTGTTTTAA ATAGCGGTCT AGGCGTAACA GTGGTCTTTT TCATATATGC TCAAACACAC 4 800 

50 

CTTGGTTTAt CAgcTGCGCA ATCTGGACTT GTTACATTGC CATATGCCAT TGTGGCAGTT 4 860 

GCGATGATTC GTTTAGGTGA AAAAGCAACA TTACGTTTCG GTGGCAAATT GATGCTCATC 4 920 
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TCACAATATG TCATTGCAGT TATCATTGGT TTCGTCATAT GTGCGATAGG TAATGGTTTA 5040 

GTCGCAACAC CTGGACTTAC GATTGCAATT TTCAGTATGC CTAATGAAAA AGTTGGTTTA 5100 

GCTACAGGAT TATATAAAAT GAGTGGTACA TTAGGTGGCT CCTTTGGTAT AGCACTAAGT 5160 

ACTACAGTTT TCAGTATGTT ACAACTAAAC TATGCACCAA GTGTAGCTGC AACCGTAACA 5220 

TTTATAGTCA GCATTGTATT GATGATCCTT GGCTCATTGT CTGCATACAT GATCATTCCA 5280 

AAAACAGTTA AATCTTAAAT ATAATAGAAG AATTATGTTT CGAAATATCT TTATCACTTT 5340 

AAAATGATAT ACAAGAAATC CAAGAAAAAT AAGCGAACTG AATAAATAAA GATTCAATTA 5400 

ACGCATCAGT ATTAGGATTC ACTCTAAAAC GATTAATAGT TTTATAAGAA GGTGTTTGAT 5460 

CTTGAGCTAA CCACATCATT CGAATACTGT CATGAAGTAA TTTCTCTATT CTACGACCAG 5520 

AAAATACAGA TTGAGTATAT GCATATAAGA TGATTTTTAA CATCATCTTT GGATGATAGG 5580 

20 ATGTTGCGcC ACGATGATGT CTGAATTCAT CGAATTTGCT ATCAGGTATC GTTTCAACAA 5640 

TTTCATTAAC ATGTCGCGAA ATATCATTTT GAGGAATTCT AACAGAAGTT TTTATTGGTA 5700 

GTGTAAGTTG GGCAAAGTGT CTTATTTTTT TAAAGTATTT CAAAGTAAAA TTACATGTTA 5760 

ATACGTAGTA TTAATGGCGA GACTCCTGAG GGAGCAGTGC CAGTCGAAGA CCGAGGCTGA 5820 

GACGGCACCC TAGGAAAGCG AAGCCATTCA ATACGAAGTA TTGTATAAAT AGAGAACAGC 5880 

AGTAAGATAT TTTCTAATTG AAAATTATCT TACTGCTGTT TTTTAGGGAT TTATGTCCCA 594 0 

GCCTCTTACT CTAATTATAT TCACTATCAA TTAGACAAAA TGGCCATTTT CAAATATCAC 6000 

GCGTTGTTTC TGACCTTGAA TATATTTATT ATAATTCTCT TTTTGAAAAT CAGTTAACAT 6060 

TAATTTAGAT GTACCGTATT TTAACACTTT TTGCATTGTT TCTATTCTCA TTTTTCTAAA 6120 

TAACCATCCA TCTTTTAACA CAATACGATT AACAGCATCA TATGATAATT CTACTGTTTC 6180 

TTTAATTTCA AATGTCTTGA ATGAAATAAT CGTGCACATT AAAAACGTAT CACCAAAGTA 6240 

40 ATAAACATCT AAATCATCAC GTTTATGTTG TCCAACTAAC AAACGACCAT ATTCGAACTC 6300 

TTTTTCTGGA TATTTCAATT CTAAAAAACT AATAATCTCT TCTTCTTTTA ATTTGAATTG 6360 

CATTTAAAAA CATCCTCTCT TAAGTTTTAA CAAGCCTTAA TTAAAAATTT TTTCAATCAC 6420 

ATAGTTCAAT ATACATCATT TCGTTATGTT TTTTAATACT TTGTTCAAAA ACAAATATTT 64 80 

TATTCTTTAA AATAATGACT TTTGTATTTT TAATCACAAT AAACATTTTA AAATTCTTGT 6540 

TATCATAATC ATTAAAAGGT ATTAACCTTA ATAATATATT CTCTCGTCTC AACCTTAATC 6600 

GTATACTTCA GACGTCTGTT TGTAGACAAT AAAAGTCATT CACGTCTTCA TATGTCATCA 6660 

AATGTTTATC ATGATATGAT GAATATAATA ATCGGGTATA TAACTGTATG ATTAATTACA 6720 
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TGGTGTATCA GTTACAACTG TGTCACATAT TTTAAATCAT 


AATGATAGTC 


nTTTTTr Pfl P 


b U4 U 




AACAACGATA AAAAACGTAC 


ATGCTGTTTC 


AGAACGTTTA 


GG CTATGCCC 


CTAATAAAPA 


conn 


5 


TGCAAAACAA 


TTGGGCGGCA 


GTAAAATTCA AACTATTGGC 


fiTPATTTTfSP 

VX^>nX X X 


\~ x avvjv^ x x nn^. 


b y b U 




AAATCCGTTT 


TTCTCAGCAC 


TGATGCAAAG 


TATTCATGAC 


CATAAAPpAT 


PTHATYZTTYZA 


/U2U 


10 


TTTATGCTTT 


TTAACATCTA 


CAGCAACTGA 


TTTGTATGAC 


AAT ATT AAA C 


ATTTA ATTfSA 


/ u ou 


TCGAGGTATT 


GACGGATTAA 


TTATCGCACA ATACATATCA 


TCCC CGG A Pfl 


PPPTAA ATA A 


/ 14 U 




CTATCTAAAG AAACATCATG 


TACCTTATGT 


CGTACTGGAT 


P A A A ATfi A P p 


ATPAAPJ"*PTA * 


"7 "> A A 


15 


TACAGATTTT GTTCGGACAA ATGAATATCA AGGTGGACAA 


PTTflP AflPAP 


MvAl 1 1 AAi 


7260 




AGAACTCGGT 


CACAACCATA 


TGATAATTGT 


TGCACCATAT 


1 w\ IXsKa 


CCjtAATATGTC 


7320 




GACTCGTGTC 


GCTGGATTTG 


TCGATACTTT 


GCGCGCGAAT 


PR 2^HP*TY'' , PPR^ r " , 


AACCACAAAT 


7380 


20 


CGTCCATACT 


GAATTATCTA 


AGCGCGGTGG 


GCTAACCATT 




TCATGGTTCA 


7440 




ATCTGCCACT 


GCAATCTTCG 


CTATTAACGA 


TGAACTCGCT 


& *I*'I*ftP A i| m | 

nl iuoLAl 1 1 


1 ACGAGGACT 


7500 




AATTGAACAT 


GGCATCAGTA 


TCCCGAAAGA 


TATCTCATTA 




fi. 7A P TVITV 74 


7560 


25 


TTATGCAGCG 


TACGTCTCGC 


CACCTTTAAC 


TACTGTGGCA 


UvitL 1A1AA 


CTGATATTGG 


7620 




CAAAACATCT 


TTAACCTTAT 


TACTTCAACG 


ATTACAGCAC 


TTA fZ A T & A AT 




7680 


30 


GATTGAATTA 


CCAACGACTT 


TAAAAATTCG 


TGCAACAACT 


finrTJiTrATP 

X a X \*A X 


111 LAAAL 1 A 


■7*7 J! A 

774 0 


ACTACGTATC 


TTCCGAAATA 


TACTCATCAT 


TGTTAGGCCC 




1 1 l-AHlvjtwHa 


"7 o A n 

7800 




AGGGTTTTTA 


ATCATAATTA 


TTTTACTAAG 


AAATTAAAAT 


AA T IV 21 THT AT 
nnlnnluinl 


^5 ta t\ ^p^pt^^p^p r ta 
wiAi 111 1AA 


■7 O ^ A 

7860 


35 


ATATGATTTA AACGTTTTCA GTTTTTATGA AAACGCATGC 


ATTTT A P A A A 


TAA A A ATYVT 
lAAAAAlAjul 


^ Q O A 

7920 




ACGATGGCAC 


TGGTAAAACG 


TTTTACTAAA 


AACAAATCAT 


GAGGTG TAT A 


APATfiAflPAT 


*7 Q O A 




TGTTGCATTA 


CTTATCGGGT 


TAGGCCCCTT 


AATTGGCTGG 


GGCTTCTTCC 


CAACAGTCGP 


AAA ri 


40 


TTCAAAGTTT 


GGTGGTAAAC 


CTGTACATCA AATTATCGGT 


GCTACTGTAG 


GTACGTTAAT 


oxuu 




CTTCGCTATT 


TTATTAGCCG 


TAGTCACATC 


AAGTGGCTTC 


CCTACTGGAA 


CCAATTTGPT 


ft! CO 




ATTCGCCTTA 


TTATCAGGTG 


CAGGATGGGG 


ATTCGGACAA 


ATCATTACAT 


TTAAAfiPflTT 

X x <rwv*7\«>w X X 


ft o *> n 


45 


CGAATTAGTC 


GGCTCATCTC 


GTGCCATGCC 


AGTCACAACA 


GCATTCCAAT 


TATTAGGCGC 


8280 




ATCTTTATGG 


GGTGTCTTTG 


CATTAGGAAA 


TTGGCCAGGC 


ATTGGTCATA 


AAATCATTGG 


8340 


50 


ATTTACAGCT 


TTAGTCGTTA 


TTCTAATTGG 


AGCGCGTATG 


ACAGTTTGGA 


GTGAACGCAA 


8400 




AGAAGCAAGT AACGCCAAAA ATTTACGTCG 


TGCAGTGGTA 


CTTCTGTTAA 


TTGGTGAATT 


8460 




TGGATACTGG 


TTATATTCAG 


CTGCACCGCA 


AGCAACTTCT 


ATTGATGGCC 


TAACTGCCTT 


8520 
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45 



50 



AGCAGAGAAT 
TGCATTTGGT 
TGGATTTATT 
AAAACAACAT 
AGTAGCCGCT 
GCTGTTTTAA 
ACGATTAATG 
ACTAAAAACT 
CAAAAAATAT 
AAACAATTGA 
AACTTAGCTC 
AATATTGCAT 
ATGACCAACA 
AGATATGCAC 
GGTAAAGGTG 
ACTAAAATTG 
ATTGATACAT 
GTGAATGCAG 
CCTGAAGATG 
TTAGAAGTAC 
ACGACAGTAT 
GATATTATTG 
GAACAATCTA 
ATTACGCTAG 
GCTTATAAAG 
GTCAGTCGCT 
GCGAGCTCAC 
GTAAATCAAG 
CAACATTCGT 



CCATTCCGTA 
GCTTTAACAT 
CTTTCTCAAA 
AAAACGTCAA 
TCTGTTACAG 
ATGAACATAT 
ACGCTGGCAT 
TACCACGCTT 
ACTTAGCAGA 
TTTCATCGGA 
ACCCATTAAA 
TAGAATCGAA 
AAGTTGTTAT 
AACCAGGCGA 
CCAACCAGGC 
GCACTGATGG 
CATATATTAT 
AAGGACAAAA 
TTATTAACGC 
CCATCCCGGC 
TAAATCCTGC 
TGCCAAACGA 
TGAAAGACAA 
GTAAGCAAGG 
TAAATGCGAT 
TAAACAAGTC 
TCACTGTACA 
TTTAAATGAA 
ATATCATGGC 



ATAAAATTAC 
ATCTTATTTC 
CATCCGTTGT 
AAGAAATGGT 
TATTTATAAA 
TTCAAAAGCA 
GCCAATTCCA 
TATTGATGTC 
AGAAATAAAA 
AATCGAAATC 
TAAAGGTAAT 
TGTTACTTTT 
TTTAGGTTCA 
AACATTACAT 
TATTGCCACT 
CGTTGCTGAT 
CAAAACAGCT 
CACCATCTAT 
AAAAGACGCT 
TATTATATCT 
ACCAGCGAAA 
AACAGAAGCC 
TGCCAATTAC 
TACATATTTT 
TGATACAACT 
GCAAGATAAC 
AAAACACGGC 
TCAAACACAG 
TGTGCTTTTT 



GTGGTTACAA ATTATTTCAG GTTTCTTCTT 8640 

AGCACAACCT AATATGAATG GTTTAGCAAC 8700 

GCTTGCTACA TTAACTGGTA TTTATTTCTT 8760 

TATTACAATC ATCGGCTTAG TACTGATTTT 8820 

ATAAGGAGTG TAGATGTCAT GAAAAAATCA 8880 

ATCGCGACAA TTGGTCATTT TGATTTATTA 8940 

AATGATCATC GTCGTATCGA CCTAGCTGTA 9000 

TTAGCTACAG TGTTAGAAGA AATGGAAATC 9060 

GAACATAACC CTACACAATT GCAACAAATT 9120 

ATTTTCATTC CTCACGAAGA AATGAAAAGT 9180 

ATTCGTACTG GTGAAaCAAC GCCCTACTCT 9240 

TAAAAGTTAT AACTTGAAAG GAGCGTACAC 9300 

ACGAATGTCG ATCAATTTTT AACAGTTGAA 9360 

GTTGAAGAAG CACAAAAAGC ATTCGGCGGA 9420 

GCACGCATGC AAGCAGACAC AACATTTATT 9480 
TTCATCTTAG AAGATTTTAA AGTAGCTCAT 9540 
GAAGCAAAAA CGGGCCAAGC CTTTATCACT 9600 
GTTTATGGTG GTGCGAATAT GACGATGACA 9660 
ATAATCAATG CAGACTTTGT CGtTGCACAA 9720 
GCATTTGAAA TTGCCAAGGC ACATGGTGTG 9780 
GCATTACCTA ATGAATTATT ATCATTAATC 9840 
GAATTGTTAT CTGGGATTAA AGTAACTAAT 9900 
TTTTTATCTA TAGGCATTAA GACTGTTTTG 9960 

GCTACTAAAA ATCAAAGCCA ACACATCGAA 10020 

GCTGCAGGCG ACACATTTAT TGGTGCATTT 10080 

TTAGCAGATG CTATTGATTT TGGTAATAAA 10140 

GCGCAAGCAT CTATTCCTCT ACTAGAAGAA 10200 

CTATGATATG AAGGTTTAGC ATATAACATG 10260 

TATCTTTATA AAACATCATC TATTAGAAAT 10320 
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TTTGTAATCT TTTTAACTTC CAAATTaTCG CATATAAATA TGCTATATTA ATGATAATAA 
TTATCAATTA AAAGGAGGTT ATGCTATGTC TAAAGAAGCT GGTCATACAT TTTTAGCTAA 
ATTAGGAAAA ACTCGTCTAC GCCCCGGTGG TAAAGAAGCA ACAGATTGGT TAATACAACA 
AGGGGCATTT TCACAAGATA AACAAGTGTT AGAAGTGGCA TGTAATATGT GCACAACATC 
TATTTATCTA GCTCATACAT ATGGCTGTCA CATTCAAGGC GTTGATATAA ATAAGAAAGC 
ATTAGAAAAA GCACAGGAAA ACATTTCAGC AGCAGGTCTT GAATCATATA TTCAAGTTCA 
ACAAGCGAAT GCTGTTAAAT . TGCCCTTTGA TGACAATCAA TTCGATATCG TTTTAAATGA 
AGCAATGTTA ACAATGTTAC CCATCGCCAT AAAGGAAAAA GCATTACGCG AGTACTACCG 
AGTCTTAAAG CCTGGGGGTA TCTTGTTAAC ACATGATATT GTCATCGTTA ATGAATCACA 
TGCCACACAT GTTGTTAAAT CATTATCTGC AGCAATTAAT GTCAATGTCT CACCGCAGAC 
GAAACTTGGC TGGTTAGATT TATATAATCA AGCTGGTTTT AATCATGTGC ATTATCATAC 
TGGTCCAATG AGTTTAATGA CACCAAAAGG TTTAATTTAT GACGAAGGTA TTGTTGGAAC 
TATAAAGATT ATCAACAATG CTTTGAAAAA AGAAAATCGA CCAATGTTTT GTAAAATGTT 
TAAAACGATG ACTAAATTGC GTAAAGATAT GAATTATATT ACTTTTGTCG CTAAAAAAGA 
GCACTAAATA TAATGCCACT AACTGTACTT TGTATCTATG TTTGACTATC ACTTTAATTT 
CTTTGTGACA CTAATCATCT ACTTAACAAT ATCGTTATCG TTGATTAGTA AGTCATCAAT 
TTTGGTTAAA GACTTTCATA AACACTCAAA CATTAACACT ATACATAGTT AGTGGcATTA 
TTTTTTyCTn AAAATTTTAA CmTCmCGGGr TtGGGAmCrG AAaTGrtAwT TcGCrmAAtT 
TAwTcT 

(2) INFORMATION FOR SEQ ID NO: 445: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2176 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



10440 
10500 
10560 
10620 
10680 
10740 
10800 
10860 
10920 
10980 
11040 
11100 
11160 
11220 
11280 
11340 
11400 
11460 
11466 



45 



50 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 445: 

TTACATAGTT AACACTAGTT AATCTATTAG TTAACATTAG TTAATAATTA GTTAATTTCC 60 

ATTTGTATTC TCATGTGATA AATTCTAAAA GCATACaATA AATTTAATAT GTAAAAAGAA 120 

AGGGAATACA CATGAAAAAT AAATATATCT CGAAGTTGCT AGTTGGGGCA GCAACAATTA 180 

CGTTAGCTAC AATGATTTCA AATGGGGAAG CAAAAGCGAG TGAAAACACG CAACAAACTT 24 0 
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AAGTATTACA TCTAAAAGGT ATCACAGAAG 
GCGAACACCC AGAACGTGCA CAAGAAGTAT 
5 CAGACCGACG TGTTGCACAA CAAAACGCTT 
CTGAACAAGA AAAAAATAAT TACATTGCAC 
AAGTTTGGGT AGAATCAGTA CAATCTTCTA 

10 

CGGATAAAGC AATTAAAGAT TTCCAAGATA 
ATGAAGCTAA CTCAAAATTA CnTAAAGATT 
AAGTTTCAAT TGAAAArGCA ATCGTTCGTC 

15 

CAATCTCAAA ATTAAATGAA AAAGATTCAA 
TTAACAAAGC ACCTATGGAT GTAAAAGAGC 

20 CTCAAAAAGA TGCTGAAAAG AAAGTGGCGC 
CACAAATTGA AAAACCTAAA GTAGAATCAC 
CAAAAGTTGA GGTTCCTCAA TCTAAATTAT 

25 TTAACTATGG TTACAAGTAT TTAACAGATA 
CAGCAAAGTA CTACTATAAT ACGTACTATA 
TAACAGTACT AGGTAGTGGT TCTAAATCTT 

30 

ACGGCTACTT AGCTAAATCA TATGCACAAG 
CTGGTAAAGT ATTATATACT TTCTACCAAA 
CTCAAGAAAC TGCATCATCA ATCAAAAATA 

35 

AATCAATCAA AAATATCTTC TCTAGTTTTA 
CCGTGATTAA AAAGAACCGT TGATTCTCAA 

40 TCAATTAAAT GCTTCTTCGC TATTTGTCAG 
ATCCTTACAT CGTTAACGAA TAGTTCATCA 
TCATATTTTC ACAAACTATT GCG CAATCCA 

45 ACAACAATTC AATAAAATAA GACTTGCAAA 
GACCAATAAA TCTTTTAAAC ATAACATAAT 
GTCTCTTCAA TACATGTTGA TAGTAATTAA 
TACAAATGGA TTATTATATA TATGAACTTA 
ATTAAAAAtA AAATATTAAC AGCAACTTTA 

55 



AACAACGTAA CCAATACATC AAAACATTAC 360 

TCTCTGAATC ACTTAAAGAC AGCAAGAnCC 420 

TTTACAATGT TCTTAAAAAT GATAACTTAA 4 80 

AAATTAAAGA AAACCCTGAT AGaAGCCAAC 540 

AAGCTAAAGA ACGTCAAAAT ATTGAAAATG 600 

ACAAAGCACC ACACGATAAA TCAGCAGCAT 660 

TACGTGATAA AAACAACCGC TTTGTAGAAA 720 

ATGATGAGCG TGTGAAATCA GCAAATGATG 780 

TTGAAAACAG ACGTTTAGCA CAACGTGAAG 84 0 

ATTTACAGAA ACAATTAGAC GCATTAGTTG 900 

CAAAAGTTGA GGCTCCTCAA ATTCAATCAC 960 

CAAAAGTTGA AGTCCCTCAA ATTCAATCAC 1020 

TAGGTTACTA CCAATCATTA AAAGATTCAT 1080 

CTTATAAAAG CTATAAAGAa AAATATGATA 1140 

AATACCAAGG TGCGATTGAT CAAACAGTAT 1200 

ACATCCAACC ATTGAAAGTT GATGATAAAA 1260 

TAAGAAACTA TGTAACTGAG TCAATCAATA 1320 

ACCCAACATT AGTAAAAACA GCTATTAAAG 1380 

CATTAAGTAA TTTATTATCA TTCTGGAAAT 1440 

CATCATTTTT TAAATAATTT TCGTAACAAA 1500 

TCGAATCTAC GGTTCTTTTT TCATTTTCCA 1560 

CCCACTTTTT TACCTGCAAC TTGTTAAATA 1620 

TTTAGTTGAA TCAGCTCAAC TTTATTAACT 1680 

TTCCTTTTCC ACTACAAGCA CCATAATTAA 1740 

GCATAGTTAT GTAGCTATAT AAACGCCTGC 1800 

GCAAAAACAT CATTTAACAA TGCTAAAAAT 1860 

CTTTTAACGA ACAGTTAATT CGAAAACGCT 1920 

AAATTAAATA GAAAGAAAGT GATTTCTATG 1980 

GCAGTTGGTT TAATAGCCCC TTTAGCCAAT 2040 



1358 



EP0 786 519 A2 



CmTyCAAArG AcACaGACAT TACTAGCCAA CGATTTAGCT ATnACTCCAA ACCTTCCATT 2160 
GGATTTGGTA AAGGnT 2176 
5 (2) INFORMATION FOR SEQ ID NO: 446: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1557 base pairs 

(B) TYPE: nucleic acid 

70 (C) STRANDEDNESS : double 

<D) TOPOLOGY: linear 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 446: 

75 





AAAAGCATGG 


CTTAAATGAA 


GTACGCTATA 


ACAAATTACA 


AGAACATGCT 


ATTGTTATGC 


60 




ATCCGGCACC 


TGTGAATAGA 


GGAGTAGAAA 


TACAAAGCGA 


TTTAGTAGAA 


GCTTCAAAAT 


120 


20 


CAAGAATTTT 


TAAGCAAATG 


GAAAATGGCG 


TTTACTTAAG 


AATGGCAGTC 


ATTGATGAAT 


180 




TATTAAAATA 


GGTAAGGGGA 


CGAAAATGAT 


GAAATTAATT 


AAAAACGGTA 


AAGTATTACA 


240 




AAATGGCGAA 


TTACAACAAG 


CAGATATTTT 


AATTGATGGT 


AAGGTAATTA 


AACAAATTGC 


300 


25 


ACCTGCAATT 


GAACCAAGCA 


ATGGTGTTGA 


CATCATAGAT 


GCGAAAGGTC 


ACTTTGTGTC 


360 




ACCTGGATTT 


GTCGATGTTC 


ATGTTCATTT 


ACGTGAACCT 


GGTGGTGAAT 


ATAAAGAGAC 


420 




AATTGAAACT 


GGTACTAAAG 


CTGCTGCTAG 


AGGCGGATTT 


ACAACTGTAT 


GTCCAATGCC 


480 


30 


TAACACAAGA 


CCGGTACCAG 


ATTCTGTAGA 


ACATTTTGAA 


GCTTTACAAA 


AATTAATCGA 


540 




TGACAATGCT 


CAAGTACGTG 


TATTACCTTA 


TGCTTCAATT 


ACAACACGTC 


AATTAGGTAA 


600 


35 


AGAATTGGTT 


GATTTCCCAG 


CACTAGTAAA 


AGAAGGTGCC 


TTTGCGTTTA 


CAGATGACGG 


660 


TGTAGGAGTA 


CAAACTGCAA 


GCATGATGTA 


TGAAGGCATG 


ATTGAAGCTG 


CAAAAGTAAA 


720 




CAAAGCCATC 


GTAGCACACT 


GTGAAGATAA 


TTCATTAATC 


TATGGTGGTG 


CAATGCATGA 


780 


40 


AGGGAAACGC 


AGTAAAGAGT 


TAGGTATACC 


AGGTATTCCA 


AACATTTGTG 


AATCTGTTCA 


840 




AATCGCAAGA 


GATGTACTAT 


TaGCTGAAGC 


AGCAGGTTGT 


CATTATCATG 


TATGTCATGT 


900 




TTCTACTAAA 


GAAAGTGTTA 


GAGTCATTCG 


TGACGCTAAA 


CGCGCAGGCA 


TTCATGTTAC 


960 


45 


AGCTGAAGTT 


ACACCACACC 


ATTTATTGTT 


AACAGAAGAT 


GATATTCCTG 


GTAATAATGC 


1020 




CATTTATAAA 


ATGAATCCAC 


CATTGAGAAG 


TACTGAAGAT 


AGAGAGGCTT 


TGTTAGAAGG 


1080 




GTTACTAGAC 


GGTACAATTG 


ACTGTATCGC 


AACAGAcCAT 


GCACCACATG 


CACGTGATGA 


1140 


50 


AAAAGCACAA 


CCAATGGAAA 


AAGCaCCATT 


CGGAATTGTT 


GGTAGTGAAA 


CAGCATTCCC 


1200 




ATTATTATAT 


ACGCATTTTG 


TAAAAAATGG 


TGATTGGACA 


TTACAACAAT 


TAGTAGATTA 


1260 
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TTATGCAGAT TTAACAATCA TTGATTTAGA TAGTGAACAA 


GAAATTAAAG 


GAGAAGATTT 


1380 




CTTATCAAAA GCAGATAATA CACCATTTAT CGGCTATAAA GTTTATGGAA ATCCGATCTT 


1440 


5 


AACAATGGTT GAAGGCGAAG TTAAATTTGa GGGGGATAAa TArTATGCAA gCAAACGTTA 


1500 




TCTAGTGTTA GAAGACGGTC TTTTACGAGG CTACCGTTAG 


GTCTGATAAC 


TTACTGA 


1557 




(2) INFORMATION FOR SEQ ID NO: 447: 








10 
15 


(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1799 base pairs 
{&) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 










(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 447: 






20 


GCTAGAAATtn TTGmATGaCA ATACAACTCT GTTAAAaTGA 


TGGACGTAGA 




60 




TATTGACGCT TTATTTTAAA AATTaACATG CTTATAACAT 


GTTTATAGAA 




120 




CTATGAACTA TCaAGTTCTT TTATATTATA AATATATGAC 


GATTGATGAC 




180 


25 


TGCTCAGGAT CACTTAGCCT TTTGTAAAGC ACACCATTTA AAAGGTAGAA 


i iUi 1\3 HIV. 


240 




TACAGAAGGT ATTAACGGCA CATTATCTGG TACAAAAGAA 


GAAACCGAAC 


nnlnlnlUUN. 


300 




ACATATGCAT GCCGATGAAC GATTCAAAGA TATGGTGTTT 


AAAATTGATG 




360 


30 


ACATGCTTTT AAGAAAATGC ATGTACGTCC TCGAAAAGAA 


ATCGTTGCTT 


T a f2 A TTT A A 


420 




AGATGACGTC GATCCAAGAC ACACAACTGG CCAATATTTA 


TCACCTGTAG 


A A TTT AH A A A 
. nn x x x ^vj.nn^* 


480 




AGCTCTTGAA GATGATGACA CAGTCATTAT TGATGCACGT 


AATGATTATG 


AATTTCATTT 

ru^x x x wffc x x * 


540 


35 


AGGTCATTTC CGAGGTGCAA TTCGTCCAAA TATCACACGT 


TTTAGAGATT 


TGCCTGACTG 


600 




GATTAAAGAG AATAAAGCGT TATTTGCAGA TAAAAAAGTG 


GTTACGTACT 


GTACTGGTGG 


660 


40 


CATTCGATGC GAAAAATTTT CTGGATGGCT TTTAAAAGAA 


GGTTTCGAAG 


ATGTAGCTCA 


720 


ACTTCATGGC GGTATTGCTA CATATGGTAA AGATCCTGAA 


ACAAAAGGTG 


AATATTGGGA 


780 




CGGTAAAATG TACGTATTTG ATGACCGTAT CAGTGTTGAT 


ATCAACCAAG 


TTGAAAAnAC 


840 


45 


AATTATTGGT AAGGATTGGT TTGATGGCAA ACCATGTGAA 


CGTTATATTA 


ATTGCGCTAA 


900 




CCCAGAATGT AATAAACAAA TATTAGTTTC TGAAGAAAAC 


GAAACTAAAT 


ATTTAGGTGC 


960 




ATGCTCTTAT GAATGTGCTA AACATGAGCG TAATCGTTAT 


GTTCAAGCAA 


ATAATATTAG 


1020 


SO 


TGATAATGAG TGGCAACAAC GTTTAACAAA CTTTGATGAT 


TTACATCAAC ATGCTTAGTT 


1080 




TTAATTAAAT ACCTTTCAAA ACACGCTTTG AAAATCCGAT 


TTATAAAGGT 


TTTTCAAGGC 


1140 
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TAAATTTTAA TACTGCGGGG TGTCTTAAAA TGCACATTTT AGTAACAGGG TTTGCGCCTT 1260 

TTGACAATCA AAATATCAAT CCCTCATGGG AAGCTGTGAC TCAACTAGAA GATATTATTG 1320 

5 GCACACATAC AATCGATAAA TTAAAACTAC CAACCTCTTT TAAGAAAGTA GATAATATTA 1380 

TAAATAAAAC GTTGGCATCT AATCATTATG ATGTTGTACT AGCTATAGGA CAAGCTGGTG 144 0 

GTAGAAATGC CATTACCCCA GAACGTGTCG CCATTAATAT TGATGATGCA CGTATTCCAG 1500 

10 

ATAATGATGA TTTTCAACCT ATTGATCAAG CCATTCACTT AGACGGTGCG CCAGCTTATT 1560 

TTTCAAATTT ACCaGTTAAA GCAATGACTC AAAGTATTAT TAATCAAGGA CTTCCTGGAG 1620 

CACTTTCAAA TAGCGCAGGT ACATTTGTTT GTAATCACAC ACTTTATcAC TTAGGTTATT 1680 

15 

TACAAGATAA GCATTACCCT CACCTACGAT TCGGATTTAT TCaTGTGCCA TACATACCAG 1740 

AGCAGGTcAT TGGTAAACCC GATACACCAT CTCATGnCCA TTGAGGAAAA GATnAGTTG 1799 
2Q (2) INFORMATION FOR SEQ ID NO: 448: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1341 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

25 (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 448: 



30 


ACTTGGTTTT 


TTATTGTTTA 


TAAATAAAAC 


TCACTTAATA 


ATGTTTTCAT 


AATCTTCTTC 


60 




GACTACTTAA 


TTCTTTAAGA 


TATTCGTGAA 


AAGAGACATT 


ACACTAGTTA 


ATTTTCAAAC 


120 




AATACAAAAA 


GCGTCTACCT 


CCTACATATA 


ATTGTAGCGG 


AGATAGACGC 


TTAATATTTA 


180 


35 


TTTAAAAATT 


ATTTTAAACC 


ACCGAATGTC 


ATAACATCAC 


GGGCAATCAT 


ACTTTCTTCA 


240 




TCTGTTGGAA 


TAACGACAAC 


TTTAACTGGT 


GAATGAGGAT 


AGTTAATAAA 


TCCTTCTTTA 


300 


40 


CCACGTAGTA 


AGTTTTCATT 


TTTCTTAGGA 


TCCCAGTAAA 


CACCCATAAA 


TTCTAAGCCT 


360 


TCAAGAACTT 


TCGCACGAAT 


TTCTACTGAG 


TTTTCACCGA 


TACCTGCTGT 


AAATACGATA 


420 




ACATCAACAC 


CATGCATTCT 


CGCAGCATAT 


GATCCAATAT 


ATTTGTGAAT 


TTTAGAAGCA 


480 


45 


AATACATCTA 


AAGCCATTTG 


TGAACGTGCT 


TTACCTGATT 


CAGCTTCTTC 


TGATAAGTCA 


540 




CGTAAATCAC 


TAGATGTACC 


TGATAATCCT 


AATAAACCTG 


ATTCTTTGTT 


TAAGATTTCC 


600 




AATACTTGTT 


CAGCAGTTTT 


ACCTGTTTTT 


TCCATAATAA 


ATGGAATTAA 


AGCAGGGTCA 


660 


50 


ATATTACCAG 


AACGAGTACC 


CATTGTTACA 


CCAGCAAGTG 


GTGTGAAGCC 


aTTGATGTAT 


720 




CAATAGATTT 


ACCGCCATCG 


ATAGCTGCAA 


TTGATGCTCC 


ATTACCAATG 


TGACATGAAA 


7B0 
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TATGGCTTGT ACCATGGAAA CCATACTTAC GAATGCCATA ATCTTTATAA TAATGATATG 900 

GCAAGCTATA TAGATATGCT TTTTCAGGCA TTGTTTGATG GAATGCTGTA TCAAAAATTG 960 

5 CCACATGAGG GATATTTGGT AATAATTTAC GGAAAGCACG AATACCCAtC AAGTTaGCTG 1020 

GGTTGTGaAG CGGTGCTAAT TcGCTTAATT CTTCAATTTC CTTTTCAACC TCATCAGTAA 1080 

TAGCTACTGA TTCAGGGAAT TTTTCACCAC CATGTACAAC ACGGTGACCT GTTCCATCGA 114 0 

10 

TATCGTTAAT ATCATTAATA ATATTGTGCG CTTTAAAAGC ATCCAACATG ATATCAACTG 1200 

CCTCAACGTG ATCCTTGATA TCTTGTACTG TTTTAACTTT TTCCCCGTTG ACTTCAATTG 1260 

TAAAAATTGA ATCCTTCAAT CCGATTCTTT CTACTAAACC TTTTGTTACT AATTCCTCTT 1320 

15 

CAGGCATTCT AATTAATTGA A 1341 
(2) INFORMATION FOR SEQ ID NO: 44 9: 

2Q (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1529 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

25 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 449: 
TTTTGAAGAT ACTACCGATG AAAATAGACA AAAGATTTTT CAATATTTAT CACCTGAAgA 60 
30 AGTTGCAAAT TTCTTTGATC AATTAGATAT TGATGACGAT GAATATGAGT TGCTATTTGA 120 

TAAGATGAAT GCGACATACG CAAGTCACAT ATTAGAAGAA ATGTCATACG ACAATGCAGT 180 
, AGATATTTTA AATGAGTTGA CTAAACCAAA AGTTGCTAGT CTTTTAACAT TGATGAATAA 24 0 

35 

AGATGACGCG AATGAAATCA AAGCATTACT TCACTATGAT GAGGATACGG CCGGCGGTAT 300 
TATGACGACG GAgTATTTAT CACTTAAAGC GCATACGCCT GTTAAAGAAG CATTATTATT * 360 
GGTCAAAGCG CAaGCACCAG ACGCAGAAAC AATATATGTT ATATTTGTCG TTGATGATGA 420 

40 

TGGTAAATTA GTAGGTGTTT TATCGCTAAG AGATTTAATT GTAGCTGAAA ATGATGCTTA 4 80 

TATTGAAGAT ATTATGAATG AACGTGTCAT TAGTGTGAAT GTAGCAGACG ACCAAGAAGA 540 

45 TGTTGCTCAA GTTATGAGAG ACTATGATTT CATGGCTGTA CCTGTTATAG ATTACCAAGA 600 

ACATTTGCTT GGTATCATCA CGATTGATGA TATTTTAGAC GTTATGGATG AAGAGGCTAG 660 
TGAAGACTAC TCTCGTTTAG CCGGGGTATC AGATATCGAT TCGACTAATG ATTCAATCAT 720 

50 TAAAACAGCA TTAAAACGTT TACCATGGTT GATTATTTTA ACATTTTTAG GAATGATTAC 780 

TGCGACAATT TTAGGGAGAT TCGAAAAAAC ATTAGAAAAT GTAGCGCTAC TCGCAGCGTT 840 

55 
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TCGTAACATT ACGAcAGGGG AAATTAATGA GCAAAGTAAA TTTAGAATTG CATTAAGAGA 960 

AGCAGGAAGT GGTGTATTAT CGGGTGTTGT ATGTTCAACA ATATTATTTA CAATTATTGT 1020 

5 TGCAATATAT CATCAGCCAC TTTTAGCATT AATCGTTGCA GGAAGTTTAA CTTGTGCGAT 1080 

GACGGTGGGG ACGTTTGTAG GTTCGATGAT TCCATTATTG ATGAATAAAT TAAATATCGA 114 0 

TCCAGCAGTG GCTAGTGGAC CATTTATTAC AACAATTAAT GATATTATTA GTATGTTGAT 1200 

10 

TTATTTTGGT TTAGCTACAT CATTTATGGC TTACTTAATT TAAGGAGGAG TTATGGAGTT 1260 

TTTATCTTTA GTTATTGTTG TTTTAGCAGC GTTTTTAACT CCAATAATTG TCAATCGATT 1320 

AAATATTAAT TTCTTGCCAG TTGTTGTTGC AGAAATTTTG ATGGGGATTG TGATTGGAAA 1380 

15 

TTCATTTCTA AATATAGTAG AAAGGGATTC AATTCTAAAT ATTTTATCAA CGTTAGGCTT 1440 

TATCTTTTTA ATGTTTTTAA GTGGTTTAGA AATTGATTTT AAAGCTTTTA AAAAAGATAA 1.500 

ACGCGCACGT CAAGGACAAA ATGATGATG 1529 

SO 

(2) INFORMATION FOR SEQ ID NO: 450; 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 1827 base pairs 
25 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double. 

(D) TOPOLOGY: linear 

30 (Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 450: 

nGGCATCCAT ATCACCCAAT 60 

ACTTTGAAAA TCTTTAATCC 120 

TGGTGCTTGT ATAAAGTAAT 180 

TATATAAACG ACTGCCGACT 24 0 

ATATTTTTTC ACTAAACTTC 300 

TTCTATTTTA AATACTGCGA 360 

ATGTGATTTT TCTGTTTTCA 420 

GTTTACAACG TTCTTTAATG 4 80 

ATCATCATAC TTTGAAACTT 540 

TGTTGTTTCT ACAGGTGTAC 600 

ACTCCCAGGT ATGTAGATTA 660 

ATCTGCTGCG ATTAATGTTA 720 



TTCTGGAAAC CAAAGTATTG TCATCTTCTA CTAGTAGTAT 
ATCATTTAGT ATATTTCATA TTTTCTCCTG ATTTTAATCG 
55 GGCAGTCAAC TTCAAAGCCA TGAATCATCA TTTTTTGCAT 

AAATCGGCCA AAATAATCGA GGGATATAAT CGTATAGATG 
CTTTGATTAA TCTAAATTCT AACTTCCCTT GATTAACTGT 

40 

CACTCAATAA AATTAAAGTT ATTATTCCAT CAGCTGTTTC 
GCGGTCGCAC CTTATTCTTA ATATATATCT TAAATTGATC 
CAAAAGTTCC TTTAGTGTAA CCCATCCATG CAATAAAATG 

45 

TCCATCCCTT TGGTAAAACT ACCTTCATCG TTGATCTAAC 
GTAATTCTAC ATTAACTAAA GAACGTTTAA AAACTAAATT 
50 CATATGCACC TAGGCGTTCA ATTGTTTCAT TATCATAACG 

CTTTTTTTAC TTGATTGATA GCCGCTGCTC GACCAAAATT 

55 
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CAGCAATATC TATTTGATTC ATTGCTGCAA CAACCTGTTC GTAATGAAAT ATATCACACT 840 

GAATCCAAGT CATTTCAACA TCATCTGTTT kTTTATTGTC TGGATATTTT GATATAGCAA 900 

5 AAAGTTCAGC ATCATTTTCA ATCACTTCAC TTAAATACTT ACCAATATAT CCTGTTCCAC 960 

CTGCTAATAA AACTTTAGGT TTCATCTAAA ATACTCCTTT AAACTGTAAC CAAAAAACAT 1020 

ATTACTCCAC CTTTTAGTTA CATATATATT ATAATAGTAG CAAATGTTTT AAAATTTCAA 1080 

10 AATACTGGAG GCTTTTTATG GCCCATATTA TACGTAGAGT TAGTATCAAA GATGTAGAAA 1140 

ATTTCATTTC AATGTTAGCG AACATATACG ACGAATCTCC GTATATGTTC TACACACCAG 1200 

GAGAATATGA TCCTAGCGTC ACATCGGCTA GTAAACAATT AGAAGAATAT ATCACTTCTC 1260 

15 

CGCATAAAGT CATCTTCGTT GCTGAAAGTG ATGAACAACT CGTTGGCTTT GCCTTTGTTA 1320 

ATACGACACC ATTTCAACGC ATTAAACATG TTGCTAAAAT TGATTTAGGT GTAAAGAAAT 1380 

TATATCAACA TCGTGGAATT, GGCCAAGCAC TTCTTGATGC CATTATGGCT TGGTGTTTAA 1440 

20 

ACAATCAAAT ACACCGAATT GAAGCAAATG TACCACTCAA TAACCAACCT GCCCTCGAGC 1500 

TTTTTAAAAG TGCCGATTTT CAAATCGAAG GCGTTTTAAA AGATAAGTTA TTTATCGATG 1560 

25 GTAAATATTA TGATGACTAT ATGATGGCTA AAATTCTTAA TTAAAGCTAT TTTATCATAA 1620 

TCTTGTATCA GAATCGTATA ACAACGAATT TAATGGTTAC CTAATACATT ACTCATACTT 1680 

ATCAATGTTA TCTAATCTCA AATAAATACG TACACTCTTA TTCATTTATC AAATTTAAAT 1740 

30 TCAAAATAnA ACACCACTAA TGTGTAATTG ATTAACTATC AACTACGATT AGTGGTGCTT 1800 

TATATATGTG GTTAGTTTTC CTnACTA 1827 
(2) INFORMATION FOR SEQ ID NO: 451: 

55 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 616 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

40 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 451: 

ATATAGATTA ATGTTTGTTA TTTGTACTGT GTTTGCCAGT GACATTTATT ATAAAACATA 60 

45 

TGACGTTATT CTATGkTGTA CTCATTtTCT ATATTGTAGG TTTATTAACG ATTAGAAGTA 120 

TTATTAAAAA GTTGAAATAT CAGGAAACAT TATTACGAGA CTAAAAAACT TCCATTGGCA 180 

SO TGTATGTTGT AAAGGTGCAT GTAATGTTGA ACGCCAAATG ATACGGCGTT CAGATTACAT 24 0 

TAGCATCTAT ACGTTAACAG CATAACCAAT GGAAGTTTTC TTCGAATCTA TTCTTTTATT 300 

55 
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AATGCGTCTT TTGAAAAATG GTCATTAAAG GCATCAGATT GCTTAAAGTC TTCGTATGCA 



420 



TGTCGATCAG CAAATCCGAA ATAAATTTTG TATGTTGTAC CTTTAGCAGG TCTTAACAAA 



4B0 



CGATAGCTTT TAAAGCCACC AAAGTTTCTG AAATTATCGT CTACACTAAT CAGTTTCTTT 



54 0 



TCAAGTTGAT ATGCATGATC TTCTGTTGAT GGaATGAAgA TTGCACaATA GAAATGaTGT 



600^ 



TCACtGAATT CACCAA 



616 



10 



15 



20 



25 



30 



35 



40 



45 



50 



(2) INFORMATION FOR SEQ ID NO: 452: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 944 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 452: 

GCACGAGTGA TTAAACGGTT AATCAATGAA ACATTTGATG CAAATTACAT TGAAGTTATT 60 

GAGGGAGGAA TTGAAGAAAC GCAAACGTTA ATTCACTTAC CTTTTGACTA TGTCTTCTTT 120 

ACAGGAAGTG nAAATGTAGG CAAAATCGTT TATCAAGCTG CCAGCGAAAA TTTAGTTCCT 180 

GTGACATTAG AAATGGGCgG TAAAtCTCCa GTCaTCGtTG ATGAAACAGC GAATATTAAA 240 

gTTGCTAGTG AGCGCATTTG TTTTGGGAAA TTCACTAATG CCgGCCaAAC ATGTGTTGCa 300 

CCAGATTACA TTTTAGTACA CGAATCTGTA AAAGATGATT TAATCACAGC CCTATCAAAA 360 

ACGTTGCGTG AATTTTATGG TCAAAATATA CAACAAAGTC CAGATTATGG CCGCATTGTA 420 

AACCTTAAAC ATTATCATCG TCTGACTTCA TTACTTAACA GTGCACAAAT GAATATTGTA 4 80 

TTTGGTGGTC ATAGTGATGA GGATGAACGT TATATAGAAC CAACATTGTT AGATCACGTT 540 

ACAAGTGATT CAGCAATTAT GCAAGAAGAA ATTTTTGGTC CTATCTTACC GATTTTAACG 600 

TATCAGTCAT TGGATGAAGC AATAGCCTTT ATTCACCAAA GACCAAAACC TTTGAGTTTA 660 

TATTTATTTA GCGAAGATGA AAATGCTACA CAACGTGTAA TAAACGAGCT ATCATTTGGC 72 0 

GGCGGCGCTA TTAATGATAC ATTGATGCAC CTAGCGAATC CTAAATTACC ATTTGGTGGT 780 

GTTGGTGCCT CAGGTATGGG ACGCTATCAT GGTAAATATT CATTCGACAC TTTTACACAT 84 0 

GAAAAAAGCT ACATTTTCAA ATCnACACGA TTAGAATCAG GTGTCCATTT ACCACCATAT 900 

AAAGGTAAAT TTAAATrCAT CAAAGCTTtC t TTAAAnATT AATT 944 

(2) INFORMATION FOR SEQ ID NO: 453: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4820 base pairs 



1365 



EP 0 786 519 A2 



(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: ! 
TCTCCAGTAG ACCTTGTGTA TGAACAGTTT 

10 TTTGTTTCAA CTCAGCCTTA TCAGGATAAT 

TTGTATGATA TTTAACCTTA TGCAGCGACC 
TCACTTCATC GAAATCATGA TCTTCTCCTG 

15 TATGTGTATC CGTTAATTCC TTAGATAAAG 

ACAATGGTCC CCCGAAAAGC CCTGCTTGTT 
CTAAATGTTG TATGTTTAAT TCTTGTTCAC 

20 ATATTCACGA ATAACATTCG CTAATGCCGC 

TTTTTCAAAA CTAGTTTGTT GAGCTGCATC 

ACTGCTCTTT ATTTTTGGTA TAAACTGATC 

25 

CATGTTTTTT CTCCTTAAGT ACGCGATTAC 

TGACAATTTT ACGGCTTGAA AATCAATTTA 

TACATTTTCA AATCAATGAA AAACACAAGT 

30 

ATAAGGGGTA GATAAATATG AGTGAAATCA 
AATTATTCGA AAACTTTAGA GCGTTTGGCA 
ACGGTCAAAT GATTGATGCA AGTTCAGATT 

35 

ATTAGGAGCT AGAATGGCAT TACTAAAAAA 
TTTTGAAGAT TATATATTAT TATGGAAGTT 

40 GTACGCTTCA GAATTGATTG ATTTTGCAAA 

CAGAAATGAT TCTAAGGATT TCTTTTTACA 
TATAGAGGGA CATGATGTCT TATTGTGGAA 

45 GCATGAAAAT GCATCTTTTC GTAGTGTCTT 

GTaAATCATT TTCAAATTAT TTGTCTTAAC 
TAATTTCATA ATCAGGTATA ATTCCTGGAT 

50 

AAGTAGCTAT ACCcGCATTG ATTCCACCTA 
TAATCGAGTG CTGtCTTTCA TCCTCACCAA 

55 



!EQ ID NO: 453: 

CTTTCATATG AATGAACATC GTTTTTAAAG 60 

ATCTAGAGAC AGTCGTCTCT GGCATCTCCA 120 

CATGATTTTC GTTATAAACA AATGTATGAT 180 

CAATCCAAAA AACTGGTACT ACTTGTTGCT 240 

TAATGATTGa AAATATTTTA TGGAATGTAT 3 00 

GTCCACCAAT CACAACTTTT GAACCATTAG 360 

TTGAAAGCTT GAAAGCTTTA AATCACTCAT 420 

TTCTCTTCCA TTATTTTCTT TAGACATCCT 480 

ATATTGAAAT AATCCTGTTA TTACAGGGTC 54 0 

TTTTTCATTT AAACTAACTA CTTTACAGTC 600 

AAACTATAGT ATAAAGTCTA TACCGGTGAT 660 

ATCATGGAAA ATTTATAATA TTCATTGTTT 720 

GGTTTAATGT ATAATAATAG TAGTAAACAA 780 

AACGTCTTGA AATTAATTAC AAAACTGACG 840 

ACAAAGACTT ATACATGGTC AATGAGTTAA 900 

CACCATTTTA TGGCATATTT GTCGaGATCA 960 

AGGTGATGTC GAAGAAATCT ACTTCCCAGA 1020 

AGAAGTATTA CCAAAATATC AAAACAGAGG 1080 

GAGTTTCAAT ATGCCAATTA AAGCCATTGG 1140 

TCATGGATTT ACAGATGTGG AAGCTAAAAA 1200 

ACCATAAGAT AATAATATTC GACACTACGA 1260 

TTTTACAATT ACTTTCTTAA GCTAATATAA 1320 

GTACAATATC ATTTAGTTGT TTCCATGrAT 1380 

TATGATCAAA TCCTCTAAAa TTAAACCAGC 144 0 

GAATGTCAGA TGTTAnAGAA TCTCCaACTA 1500 

TATCATTAAA AACATAATTA AAAAATTCCG 1560 
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ACGGCGTCTG ATTTAACCTT CTCTTTTGCG 
AATCATGTCT TTTCGATAAT TCGACAATTG 
5 TAGCTTCTGC TAATCCATTT CTAAATAACA 

GATGATGTTT GAAGTAATTC ACAAATCGTT 
TTTGkTGAAA AGCTTCCCAA TGTTGGTGaT 

10 

TTGTTGCTTT ATGATTAAAA ACATTCGCCA 
AAAAATCAAC AATTGTATCA TCAAAGTCTA 
TCTCCTATAT TGTCTATGTA TCTAAATCTT 

15 

AAACTGAGTG CATAACATTA AAGTATGCTC 
TATATTAGAA TCCAAATAAT TTACCTAGTA 
TACTTGTGCC TAATTTCACA CTATCATGTT 

20 

CTTCTGCTAG TCCAGTCATT TAAATCTCTC 
CATAACATAT TGAAATTAGA ATCCGAATAA 

25 GATGCTCACA ATGCTTGTGC CTAATTTTGC 

ATCTTTAATT GCGTTAAATA AACCTTCCAT 
GATAACAAAA ACGTGCGTAg yTTTTAAATC 

30 GTTGTTATTT TAAAATAAAT TTGATGCAAT 

TGTACTTAAC TGTATTTTAA AGAGAAAAGA 
ACACAATTAA GTTGCCTGAA TTCGTATTTA 

35 TCTATAATAG TGAAAAATAT AAACATTTTT 

TTTAGATATA ATAATTCTTG TGTTGTTAAA 
ATGGCCTTCT AAGCCATCGG TCGGGGGTTC 

40 

TTATACGCAT TACCAAACAA AAGAGTTCCG 
CAGTAATATA GTATGATGCG TCACCAAAAC 
ATTAAAACAA GCATGCTTAT TCGTTATAGA 

45 

ACACTTGTTT ATACATTTTT AATTAAGTAA 
CTGAACTACA CCAACACTAC ACCAAGATTT 
SQ TTTTATTATT ATATTATTCC TATAGATTTT 

GGGGCCCGAA ATCCTATAAT TATAATTATA 



TTTCGGTTAC ACCATTAGTA ACAATATATA 16 BO 

TTTCTAATGT TTGATCAAAG TATTTAACTT 1740 

CATCTGCACG ATGCCCATCA ACTTCCATTT 1800 

CTGATAATAC TTCAGACTTC GkTAATTTAT 1860 

TGaTTTTTTT AAATGkTAAA AAATCATCCy 1920 

TATAGTGAAn CGCCCATTCT TCTGcATCAT 1980 

TCAAAATATT TTTATATCCC AATTTCCCCA 2040 

AACAGAGGCT CAAATTTCTG CAAATAAAAT 2100 

ACCCAGTTTA TTTTAAAGAA TATTAGTTAT 2160 

AACCCACACC GTTAGCAACG ATGTCTACGA 2220 

GTTGTGCAGC TTGCACAGTA TTTGCGATTG 2280 

CCTCACCTTT GAAATAATAC TGATTACTTA 2340 

TTTACCTAAT AAACCTACGC CATTTTCAAC 24 00 

GCCATCATTA TTAATTGCTG CAGTTACGGT 24 60 

TGAAAACACT CCTTAAAATT TAAATTTGAA 2520 

ACCGAAATGT TATTCGCTTA ACGTTTTGTT 2580 

TAGTTTGTTT ATCCGCACAA CATCTTATAA 264 0 

AATACAGTTA GGCATTCAAA ACTGTATTTA 2700 

AGTCTTATTG AACCTTTTTA GATAAATAGC 2760 

TATTTACAAG GTATTGCTAA TTTAAGTTCA 2820 

CGTGTCCTGG TAGCTCAGCT GGATAGAGCA 2880 

GAATCCCTCC CAGGACGTTT ATAGGTATTT 2940 

TGATTACGGG GCTCTTTTTG TTTTGAATTT 3000 

GTCCCCCGCA TAAGCCCCGA AAATACAGTA 3060 

ATTTTTTGAC ACACAATTGA CACGCGTCTG 3120 

TTTTGTGCTC AAATTTCATC TATACTGCAC 3180 

TTAACACTCA CCATTTGCAT GCGTAGAGAT 324 0 

GATACTATTC AAAATTTTAG GG ACTTTTCA 3300 

TACATCTAAA AAAAATAACC ACGTCCATCG 3360 
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ATACTATTGG CAAATTTATA AAGTAGTTCA GCGTTTTTCA ATGACATATT GTCTAATGAT 34 BO 

CTTTCATTTT TTCTCATTCT GTGTATTGTG CTTTGTGGAA CTCCTGTTTG TTTCGATATA 3540 

5 

TGTAAACTGC TCAAATCACT GTCTAATAGT TTTTGAATTT GATTTCTCAT TTTGTACACC 3600 

CCCTTGTAAA TCTTCAATCA TCATTTAAAT TAAATAATTA CTTTTCCACA TATTCCAATA 3660 

TTTAGGTTGC AAAGCATACC TCAAATATCA TTAATTTTGA GATTTAAATG TCAATTATGT 3720 

10 

GTCTATCAAT CCAATATACA TACTCTAATA ACGTAATAGT ACACACTCTT CTTATTAATT 3780 

GGCCATAGCT ATCATGATAT AATTAGTGAA GAAAATCACA TAAGAAAGGT TGTAAATCAT 3 840 

GAGACTTCAA AAAGCACCTC TAGTAACGTC AGGACTAGTC TTAGGATTAT TAGGCCTGGG 3900 

15 

TAATCTATTA AAAGACTTAT CTCTTACTTT AAACGCTGTT TGCGGAATCT TTGCTTTCTT 3960 

GATTTGGATT CACCTTTTAT GTACTATGAT CAAATATTTT AATAATGTGA AAGAACAATT 4020 

2Q AAACAGTCCT CTAGTTTCAT CAGTGTTCAC AACATTTTTC ATGTCTGGCT TTTTAGGTAC 4 080 

TACTTATTTA AATACATTTT TTAGTAACAT AACTTTTATC AATAGCTTAA TAACGCCTAT 4140 

TTGGATTTTA TGCCTTGTGG GAATTATGAC GCATATGATT ATTTTTTCAA TAAAATATTT 4200 

25 AAAAGATTTT TCACTTGAAA ATGTTTATCC TTCGTGGACT GTACTTTTTA TTGGTATTGn 4260 

TATCGCAGGA TTGACGGCAC CCGTTAGCGG ATATTTTTTC ATAGGTCAAT TAACAGTAAT 4320 

ATATGGCTTT GTAGCTACTT GTATTGTCTT ACCTATAGTT TTCAAGCGAT TAAAAGCATT 4380 

30 TCCATTGCAG ACGTCAATCA AACCGAACAC ATCGACAATT TGTGCACCAT TTTCTTTAGy 4440 

CGCTGCAGCA TATGTTATAG CTTTTCCTAA GGCGAATGCT TTTATCGTAA TTATATTTTT 4500 

ACTATTAGCT CAAATATTTT ATTTTTATAT CATTATACAA TTGCCTAAAT TACTAAAAGA 4 560 

35 

ACCTTTTTCG CCCGTATTTT CAGCTTTCAC ATTCCCTTTA GTAATCTCAG CAACTGCTTT 4620 

AAAGAACAGT TTGCCTGTAC TTATGTkTCC AGACATTtGG AAAGGkCTTT TGTTTATCGA 4680 

AGTGTTATTA GCCACTGTAA TAGTACTTAG AGTCTTTATA GGATATCTTC ACTTCTTTTT 4740 

40 

AAAAAAGGAA AAACAAGATA AATTTCTnCG TAATGCGTCT CAGTAACACT ATTACCAAGA 4 800 

ATTAACACGT ATATTTAATA 4 820 
(2) INFORMATION FOR SEQ ID NO: 454: 

45 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4353 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
so (D) TOPOLOGY: linear 
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ATTTGGATCT TTAATATCAC CAATATTTTT AATATCTTCC GGATTCAATC CATATACTTG 60 

TACTGTATCT GAGTATTTAA TTGTGAAATA ATCACCTGAT TTAACTTTGT CATCAACTGT 120 

AATTTGTGAT TTTAATGATA AATAATCTTG GGCTGGTACG ATTTTATTGT T TT TATCTGC 180 

ATCAACGACA GTtAATGTTG TATTTGATGT GATTAAATCA TTAACATTTT TAGCCTCTGT 240 

TGATGATGGC TGTACTGCTG CTATACGCAT TCTTGTATTC AAACGTTTAG GTGCTGTACT 300 

TTTTGGCAAA ATGATATCTG CATTATTTTC ATTATTTGAA TTACTATTGT TATCAACAAG 360 

AGTTTCATCA TTACTCTTGA TAGCATCACT TTTAACATTT AATGTAGTTG ATTCAGTTTT 420 

GGCATCTACC TTTTTGTTTT CCTCATTAGT TGGTTGAACA TTTACCACTG ATTTATTCTC 4 80 

TTGCAAATCA GGTTGTAACG CTTCTTGATT ACTTATAGTT TGTTTAGTGT TTAAATCTTC 540 

ATTCGTAGAT TTTGGTGAAG CTTGCTCATC TGATTTGGCA GTTGAAACTT CAACTTTATT 600 

TCCAGTGGTA GATTGTACAC TTTCTTTTTC TATTAATTTA TTCCCATTTG AAGTCGTTTC 660 

ATTACCTTGa GATGATACCA TTTCTTTTTG ATTATCATTT TTAGTATTGT CTTCTTGATT 720 

TAGTTGCTGC ATATCAACTT TATCACTCGA TTGATTATCA CTTGCTGAAG TTGTCGCTcG 780 

25 TTCAATTCTT TATTAGTACT TTCTGCAGCC TTTGC T TCTT GGTTCCCCAG ACCAAAAATT 840 

AATGTTGTAC CTACTAAAAT TGATGCTGTT CCCACTGTGT ACTTTCTAAT CGAAAATTTA 900 

TTTAATCGAT TGGATACCAT GCCTTTCCTT GTTATTGCCG TTTTATTTTC TCTGTTTAGC 960 

ATTAGATTAC TCCTAATTCA TCAAATTTTT AAATAATACA ATTGTTTTAA ATACAAAAAT 1020 

GTATATCAAT ATAGTATTAC ATTTTTAGAT AAAGCACAAT ACTTTAATTA T T TTTCTTTA 1080 

TCGTAAAACG TTATTTAACA TTTGTGTTTA AATAAAAGTT TTTATGAGTt TTGTAATCTT 1140 

TATTTAATCA TCATAAAAAA TAGTATTATT TGCCCTTGAA ATTAATATCT TAGCTTTTCT 1200 

AATTCATAGA CAATTACATT TCTGTAACAA ATTAAATTGT ATCTATTCCT TAAAGATTTT, 1260 

TTGTTTTATA TCTGGGAATT TCTAAACAGA AAAAACCAGG CCACATGGAC CTGGTTAAGT 1320 

TAATCATATT ATTTATTTTG TTTTTTACGA CGACCGAATA ACAATAATGA TCCTAATGCC 1380 

GCGAATAATC CACCGAATAA TGTGCCATTA TTTGAATTAT TATTTTCACT ACCTGTTTCT 1440 

45 GGTAATGCTT TAGCTGTTTT ATGCTGATCT TTAACCGTAC TCATTGGTTT AGCCGGAGTA 1500 

TGTTTACCTG CATCTGAATC TGAATCGCTA TCTGAATCTG AGTCGTTGTC TGAGTCCGAA 1560 

TCGCTATCTG AATCTGAGTC GCTGTCTGAA TCTGAATCGC TATCCGAGTC TGAGTCGCTA 1620 

50 

TCTGAGTCTG AGTCGCTATC TGAATCTGAA TCGCTGTCTG AGTCTGAATC GCTATCTGAG 1680 

TCTGAATCGC TGTCCGAATC TGAGTCGCTA TCTGAATCTG AATCGCTATC TGAATCTGAG 174 0 

55 
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TCTGAATCTG AGTCGCTGTC TGAATCTGAA TCACTGTCTG AGTCTGAGTC GCTGTCTGAG I860 

TCTGAATCGC TGTCAGAATC TGAGTCGCTA TCTGAGTCTG AATCTGAATC ACTGTCTGAG 1920 

5 

TCCGAATCGC TATCTGAATC TGAATCGCTA TCTGAGTCTG AGTCGCTATC CGAATCTGAG 1980 

TCGCTATCTG AGTCTGAGTC GCTATCCGAG TCTGAATCGC TGTCTGAGTC TGAGTCGCTG 2040 

TCTGAATCTG AATCGCTATC TGAGTCTGAG TCGCTGTCTG AATCGCTGTC • TGAATCTGAG 2100 

10 

TCGCTATCTG AATCTGAGTC GCTATCTGAG TCTGAATCGC TGTCAGAATC TGAGTCGCTA 2160 

TCTGATGTTT CTTCTTCGTA GTAGCCATTA TCAAGTGTGA AATCATCATG ATCCGTAATT 2220 

15 GTTACATCAA CTTCGCCACC ATCGGCATCT TTATCATCTT CAGTTGTATT TGTACCTGTT 2280 

TGAGTTAAGC CAGCAGGTTT TTCAAAGATA ACTTTGTATT TACCACTATC TAAATTATCA 2340 

AAGCGGTATT TACCATTTTC ATCTGTyTCA GTTGTACCAA TTACTTCGCC TTTTTCGTTT 2400 

20 TGCAAAGTAA CTTTAACACC TTTAATTCCT TTTTCAGTCG AATCTTGTTT ACCATCTTTA 2460 

TTACTGTCGT ACCAAACATA ATCACCTAAA CTATATTTTG GTGTTTTGTA GAATCCACTA 2520 

TCTAATGTCA TGTTGTCAGC GTCTTTAATG ACACCTGTTG TAGTTAGTCC ATCAGAATCT 2580 

25 ACAGCATCAT CTGTACCTAC ATTTGCAGTT GTCGGTGTAT AACCGGCTGG TGTTGAAAAC 2640 

TCTACACTAT AAGTTCCATT GCTTAAACCA GTGAACTGAT ATTTACCATT TTCATCTGTT 2700 

GTCGTACGAT CTAATTCTTT ACCGTTACTA TCTTTAAGAA TGACATAAAC ACCTTTAATC 2760 

30 

CCTTTTTCAT TGGCATCTTG TTTACCATCT TTATTTGTAT CTTCCCATAC ATAGTCACCT 2820 

AGATTATATT TCTTTTGGTC GCCATTAGCA GTTGATGAGC CATTCACATT TGAATAACTA 2 880 

TTTGACCAAC TATATTTAGT TTTGTCAGTG TCTAAAGTAT AATCAATTTT TCCATTATCT 2940 

35 

GTTGAACTAT TATCTGGATA AGCAACTTGT TGAATGATGT ATTGTTTATT GCTGCTTGTT 3000 

TGGCCTTTCA TTAAATCGAC TGTAGCTGTT TTATTATCAT TACTATAAAT AACATCGAAT 3060 

40 TGATCAGTAA CATCTTTAAG TTTTGAAGTA TCAGGGGTGA AACTATCCAC AAATTGATTT 3120 

TGATCTGtCA CTtCGTAAAT TTTGAAGTTT TTTGCATTTG GATTAAATTT ATATCCAGTT 3180 

AAATTAGTAA CAAACGTTTG TTTAGTATAT GTATTTTTAG GTTGATTTAC ATATGCAGTC 3240 

45 ATATTACGCG ATAAATCTTC ATTGTTAATA TAGTTTGTAC TTGAAATAAG CGGTTGTGCT 3300 

TTTTTATTAC CATAATCGAC AATGATTTCT TCGCTATATG TATCATTACC TAAAGTTACT 3360 

TCCATTTTAT AAGCTGTTTT ATCAGTTGTT GCATTTTTAC GTTTCGCAAA TGCAACTTGT 3420 

SO 

TCAAAGCTAC CTCTAACATT TGTATATTGA TCTACATAGT TCGTAAAAGT ATATGTTGTT 34 80 

GTGTTTGTTG TACTATCATA AATACCTTTT GCAATAATAT TACCTTGGGC ATTATATAAA 354 0 
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5 



JO 



15 



GTAAATGTAT 


CGCCCTCTTT 


AACAGAATCA TCGATTGTGT AATTTGCTTT TAATTTTAAA 


3660 


ACAT CACTTG 


AAGTTGCCCA 


AAATTCAGTT TTACCAGTAG TCTGATTAAC ATGTCCTTTA 


3720 


TCAATCGCAA 


TGTCAATATT 


TGAAAAATGT ACTTTATCAT TAACATTTGT TCCTTGTTGT 


37B0 


GGAGCTGCAA 


CAGTATTCAC 


TGCCATGCGA TTTAAAGTTC TTGGTTTAAT AGTCGTTGTT 


3840 


TTAGGTGTAG 


TTGAAACATC 


TTTTGCTTGT GTTAAATTAC TTTTATCAGT TTCATTACTA 


3900 


TATGTAGTTG 


ATGATTTATC 


ATTTGTTGTT ACATTGCTAG TTTTTGTAGT AGATTGATTA 


3960 


GCTGTAGCGT 


TTTGTGGTGA 


TTGCATGTTA CTACTAGTTT CTTTAACTGT TGCACTATCA 


4020 


CTCATTGTCA 


CTTTAGGCTG 


ATCTGCAGTT GCAGTTTGCG TATTGTCTTT TAGTTGACGA 


4080 


CTATCAACTT 


TTTTAGTTGT 


TTTATTCTCA CTTGGGGCTG TCGTTTCATT TTTTGATTGA 


4140 


TTTAATTCTC 


CATTCGTATG 


TTCTGCCGCT TTAGCTTCAT GACCACTTAA CCCAAAAATC 


4200 


AATGTTGTCC 


CTACTAAAAT 


TGAAGCAGTA CCTACAGAAT ACTTTCTTAT CGAAAATTTG 


4260 


TTTAATCGAT 


TTGGTATCAT 


GCCTTTnCTA TTTGTnGCTG TCTTTTTATA ATTCATTTAA 


4320 


TAATACTCCT 


TTAAAATATC 


AAAATTTGAT AAATATAA 


4358 



25 (2) INFORMATION FOR SEQ ID NO: 455: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1060 base pairs 
<B) TYPE: nucleic acid 
30 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: ! 

35 

TTGACTTCTT AATTCAGCAT TTTCTGCACT 
TCTTGCATAA ACTTCGGTAT CTATTTTACT 

40 ACCAATTAAT GCTACAATGA TAATGATAAG 

CCTTTTTGAC TTCTTTAACT TTGTATACAA 
ATTTCCCACA TTTTTATTAG TTGATTTTAG 

45 GACAGATATT GATGTTCAAT GAATATGACG 

AATTTATGTT ATAACGGTCA TTTAAATGAC 
TTGAATTCAT TAATTTTAAA ATGTATAATG 

50 

TATTTGAGAG TGAATGAAAT GAATGCTAAA 
TCATCGCAAT TATTTAAATT TCACGGTGAA 

55 



SEQ ID NO: 455: 

TAATGCTTTG TTCTTTTTAA TAAGTTGCTT 60 

ATTACTATAC CTTTGATTTA AAACTAATAT 120 

TACAACATAA AAAGACATTT TTTCACCAAT 180 

TAATAATTAA TAAAGATTAA TTGTTATTCA 240 

TTCATCATTG TTATAATCAA ATTATAAACT 3 00 

TGAAAGATTC GTGAATTCAA GTTTATGTCG 360 

AGAATTAGGT CACTCATAGT ATTTTGAAGA 420 

ATATTTGTGA AAGCGCTTGC TTAGGAGGTG 480 

GAACAATTAG TGGACAATTT AATGAAAACA 540 

GTTGCCATGC AGCTTTTCTT AAATGATGAA 600 



1371 



EP0 786 519 A2 

AAAGTTATTC CGCAATCATA TGCGTTACTA TACATAGATA AGCAAGATCA AGCAATAGCT 720 

AAAGAAGATT TATCACTTTC AAAAATTGCA AAAGTTTATG TGCAATATGA TGATACAACA 780 

5 ATAATGAGTA TTTTCGTTTA TGATGTAGTA AACGATGAAT GGATTTTTAG ATTGGATCCG 840 

AATATACGTA TACCTAAGAG TAACATATAC TTCCATAGTT TAAATTGGGA TGTGGATATA 900 

TTAAACCGGA GtCGTCTAAT GTATGTCTAA TGCaCACCAT CAGaTCATCA TtATCCATTA 960 

10 TAAcGrGCAT AGTGCATAAn yACTwCAtTT TaTTaaATTG AGaGGgGCAC GATAGGTGCA 1020 

TCAGGACATA ATATAGGAAG CATCAACGCG TGAnCAGGTC 1060 



(2) INFORMATION FOR SEQ ID NO: 456: 

15 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 1262 base pairs 

(B) TYPE: nucleic acid 
(CJ STRANDEDNESS: double 
(D) TOPOLOGY: linear 

20 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 456: 

25 ATAATnACTA AATACnAAAG TTTAACTGTC TTACTAATAA TGACTATGTT ATAATTTTAA 60 

AAGTGATATT TTGGGTAATC GCTATATTAT ATAGAGGAAA GTCCATGCTC ACACAGTCTG 120 
AGATGATTGT AGTGTTCGTG CTTGATGAAA CAATAAATCA AGGCATTAAT TTGACGGCAA 180 

30 TGAAATATCC TAAGTCTTTC GATATGGATA GAGTAATTTG AAAGTGCCAC AGTGACGTAG 240 

CTTTTATAGA AATATAAAAG GTGGAACGCG GTAAACCCCT CGAGTGAGCA ATCCAAATTT 300 
GGTAGGAGCA CTTGTTTAAC GGAATTCAAC GTATAAACGA GACACACTTC GCGAAATGAA 360 

35 

GTGGTGTAGA CAGATGGTTA TCACCTGAGT ACCAGTGTGA CTAGTGCACG TGATGAGTAC 420 
GATGGAACAG AACATGGCTT ATAGAAATAT CACTACTAGT TTAGCTCTCC TAGATGATGG 4 80 

AGAGCTTTTT TCATGAAAAG AACACTTAAA ATTAACGCCy TGTCTTGaTA tAATGACaCT 540 

40 

GCcTTGTTTT AAAATAGTAA GCGGATGCgT TAATGTATCA GCGATTAAAT TTGTTGGAAA 600 
TGTATAAAAA ACACAAGCTA AGAATAAAAT ACCTGTATAA AAGGAGAATC ATATATGTTT 660 
CAATTACTTG CAGTTTGTCC GATGGGATTA GAAGCTGTTG TTGCTAGGGA AATTCAAGAA 720 

45 

TTAGGCTATG AAACAAATGT TGAAAATGGT CGTATATTTT TTGAaGGAGA CGCAAGTGCA 780 
ATTGTAAAGG CAAATTTATG GTTGCGCACA GCAGACCGAA TCAAAaTTGT TGTTGGACGT 840 
SO TTTAACGCAA CAACGTTTGA CGAATTATTC GAACAAACCA AAGCGCTCCC TTGGGAATCT 900 

ATAATTGATA AAGAGGGTAA CTTCCCAGTT CAAGGTAGAA GCGTTAAATC AACACTACAT 960 

55 



1372 



EP0 786 519 A2 



TATAACGAAA AAGGTTGGTT AAATGAATCA GGTGCCAAAT ACCCTGTTGA AGTTGCCATT 1080 

TTAAAAGATA ATGTATTATT GACTATCGAC ACATCAGGTT CTGGTTTGAA CAGACGTGGT 114 0 

5 TATAGATTAG CACAAGGTGA AGCACCAATT AAAGAAACGT TGGCAGCAAG TTTAATCCGT 1200 

CTTGCCAAAC TGGGAAAGGT GATTACACCT TTnAATTGGT CCCATTTGCG GTTCnGGTTA 1260 

» 1262 
(2) INFORMATION FOR SEQ ID NO: 457: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1142 base pairs 

(B) TYPE: nucleic acid 

15 (C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 457: 





CCTGGCTGCT 


TTATCAGCAT 


CTACTACTTT 


AAAACCGAAT 


ACGGATAAGA GTTCTGATAC 


60 




TGTTGATTTT 


CCTGAGGCGA 


TTCCACCTGT 


TAGACCAATA 


ACTTTCGGCA 


TAATTTCACT 


120 


25 


CTTTCTTTAT 


TTTTGACATA 


CTGGACAATA 


ATGACTATTT 


CTTGTCGCGA 


TGATTTTTGT 


180 




TTCAATTTGA 


CTTCCACACA 


CTTTGCATAC 


CGGCTGCTTA 


TATACATTAA 


GATGCAATTG 


240 




CATCTCACCA 


GTTTTTCCAT 


CAGCATGACG 


ATAATCTGAA 


ATACTTGTAC 


CGCCATATTT 


300 


30 


AATACCTTCT 


TCTAGTACTT 


CTCTAACATA 


ATAAAAAACC 


ATTTCTTGTT 


GTTGGTGTGT 


360 




TAAGTCTTTT 


ACTTTTTTAT 


CTGGTAAAAC 


ACCTGCACGA 


AACAACGCTT 


CACATGCGTA 


420 


35 


AATATTTCCA 


CAACCTGCGA 


TTACTTTATG 


ATCCAAAATC 


ACTTGTTTGA 


TTGGTTTATT 


480 


CTTATTAGAC 


TGTTGATGAA 


TTCGATTTAA 


ATAATACGTC 


AATGCTTCAT 


TTGAAAAAGG 


540, 




TTCAGGCGCT 


ATTTCTAAAA 


ATGAAGGATA 


AGATGCTACA 


GACGCAACAT 


TTCTAATTTC 


600 


40 


TCCAAAACGA 


CGTATATCTG 


AATAAATTAA 


CTTTTTGTCA 


TTTGACAACT 


CAAAAATAAC 


660 




ATGCCAATGC 


TTACGATAAT 


TAGGTATCAT 


AATATCTTCA 


AGTTCATCTA 


CAATGAAAAA 


720 




ACCGCCCGCC 


ATACCTAAAT 


GACTAATTAA 


TGTACGTTGT 


TCTCGTTTAT 


TATCTAGCTG 


780 


45 


AAAAACGATA 


TATTTACTTC 


TTCGTTCTAC 


ATTTGTAATG 


GTATAGCCTT 


CCGATAAAGT 


840 




TTTAAAAGTA 


TCTAATTCAA 


TTCCTTTTAT 


AATTGTTTCC 


TTGCCTTGAG 


CTTTACCTTC 


900 




GATTACTTTA 


TCCGAAAATA 


TAACGTGTTC 


AATTTTTTGA 


TTTATAACGT AGGGTTCAAT 


960 


SO 


TCCTCTTTTT 


ACATGTTCTA 


CTTCTGGTAA 


TTCGGGCATA 


CCATTAACCT 


CACTTTATTT 


1020 




TGCATCATAC 


CAGGTTGCAC 


CATAACTTGA 


GTCTACTTTT 


AATGGAACAT 


CTArTTGCAA 


1080 
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TT 1142 

(2) INFORMATION FOR SEQ ID NO: 458: 

5 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1814 base pairs 
<B) TYPE: nucleic acid 
|C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 

10 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 458: 
CCTTTAGTAA ACAATCCTTC TTTAGTTTTA GTACGTTGTT CCAATCCAAA TAATTTGTAT 60 

15 

TTCATTGCCT CGCCCGATTG AGTGCCGCTA AAGTTATCAT CTTTCATGTT AGGCGTGTTG 120 
GTAAACATGT GTATATCACT GTTTAAACGG TCTTTATAAG CTTCGGTACC TTGTACATCG 180 

2Q TATTGCTTAT AAATATAACC ACCATCAACA GAGCCTTCTG TTTCTCTACC TTCGCTATCA 240 

GCATAAACAG TCGGTTCTAA AAACAACACG TTAGCTTCCT TTTGTTTTCT AACTTCTACA 300 
GGATCTAAAT TTAAATTACC TTTAATAAGT AACATAGCGT CATTTAAATC ACTCATATAG 360 

25 TTAGCAsymy CTGATTCAGC ATTATCATAC AAATCAATTA AAGTGATTAC TTTCTCATAA 4 20 

TCCCCTTTTC TTCTTTCGTT GTTGCTAAAT TCTGTAATAG GCATACGTTC GAAAGAGTGT 480 
GATTCAAAAC CGTTTTCACG TGGTGTGAGC TTCAATCCAT TTGTTCTACT GGTAAGATAT 540 

30 CTATAAACAC CGTGTGAAGT GAATAAATCA ACTGTAAACA CTTCATCTTC GTCAGTCTTG 600 

TCTATTGGTT TAGTTCTTAA ATATCTAACG CCTGCGATAC TATTACGTTC AATTGTATTG 660 

TCGTATATGA CAAAAGTACT CATTGCATCA CTCTTGTATA AACGCGTTTC ATCATCTTGG 720 

35 

TTTCTAATCA TTAACTCATA AGCTTTGCCA TAAATTGACA AATCTAATCC TAAAGATCTA 780 

TTGTGTGACT CAACATCATT TAAATCATTG AACGCCTCAA TAACTTCTAA TACATCTTTG 84 0 

TCATCATCTT GATATTGAAT TGGATTACCC AAGAAATAGC CGTTGATAAA ATCGCTAATA 900 

40 

TAAGATGCGT AATCATGCGC TACACGGTTA TCTGCCATGT ACTCTTCTTT GCGTCGTGTT . 960 

AACTCAACTA AGTTCTTAGT TTTACCTTCG TAATAATCAC TTAACACTTT CAATCTAGGT 1020 

45 CGTTGGTAAT CCATGTGATG TTCAATGTAT TTACTTACTT CATTAACGTT TTGTAATAAA 1080 

TCGGATTCCG TCCCGTCATA TGTGTAAACA ACATTGGCTT CATCATTAAA TAAGTAATTT 1140 

ATGTTTCCCC GTAGATCTGT ATCTGTTTCA AATTCGTTTA CTTTTAACAT TTGTTCCCTC 1200 

SO CTATAATCCT AGAGATTTTA TTGTGTCAAC TTTCGAACTG AGATTTGTGC GTTTtCTAAC 1260 

CGGTCTGTAG AATCGTTCCA CTGAATAACG CAACGAATCG ATACAATGAT TGTATGTATC 1320 
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CTCTTCAATA GTCTTGAAAC AACGTTCATC AACAATGATT TCAAATTGCA TTAAGAATTG 144 0 

TAACCCTTGT ACAACCGAGC CCTTCCCTTT TTTGGTTGGT AAAATCCTTT TAAGCCCTAG 1500 

ATTCCTTAAT TCAGCTATAC TTTTTTGTTC TGCACTATCT GCTGTAATTT CTTCTTTAGC 1560 

ATAACCAAGT TGCTTTATGA CATTAGCTAT TTCATCATTC AGCATACCTT GTTTAACATA 1620 

CTCTTCAATG ATGTATAACT TCTTTTTCTT TACATCTATT TTAGAATGTA TAAAAGCACT 1680 

AGGATCATTA ACGTAGCCAA AGTCCAATCC AAAATAAGAA GGTAAATGTC TTAACTCATC 174 0 

TTTATTTATT AAACGTTTTT CATACTTAGG GAAAACCAAT TTGTCTAGTG TAGCAAATTC 1800 

ACCTAACGCA TAAA 1814 
(2) INFORMATION FOR SEQ ID NO: 459: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 686 base pairs 

(B) TYPE: nucleic acid 
20 (C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



2S . (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 459: 

AATTnAGATT ATTACCCTCC TTTAAAAATA TTTGTTTCAC AATTTTTTAT TACCTATTTA 60 

CTGGTTTCAT GTCTTATGGG GCATTTTACT TGTTGGTATT TGAAAATGTG CAAAATTTAA 120 

30 TCTTATATGT TTCTTGGCTT TTCATGACTA TGCTATTTAT GTTTATGAAT ATGCATTCAA 180 

TTATAGATAA AAAAGTACAT ATATTCTTAA AGTCTAATAA ATAGTTACAA ATTTAGTTAG 24 0 

TTTTCAATTG TTAATTAGGG GTGGTAAACA GTGCTTTGTG AATCTAGACA AATTTATAAA 300 

AATCCTAAAT ATCGAGTTAT TAGATATAAT AATGAATATT TCATGGTCGA TTTAGTAAGT 360 

ACTTGGATTA CTTATTTTTT CCCTATGATT AATTGGTTTT TGCCCAAAAA ATACGCAAAA 420 

ATTAGCGAAA ATGAATTTGA AAGGTTAAAT ATAGTCGAGC CTGTTAAAAA TAATGTTTTT 480 

TGGCCGGTTG CAGGAAGTTC AGTTCTATTT GGAATTATAT TGAGAAAGTA CGGTAACTTC 54 0 

TTTAATGTTC AGTTTGAAAA ACAACTAGCA ATCACTGTAT TTTTTATCAT GTTAATAGGG 600 

ATGTTAATTT TTTATTTTTA TCTAAATAAA AAATTAACAT TAAAAATTTT TAATACCAAC 660 

GTGGGTAATA AGAATAGGAG TTGTAT 686 
(2) INFORMATION FOR SEQ ID NO: 460: 



SO (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1300 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 460: 
5 ATCTGCAATT ATGGGCACAC CCAAGCTnAT GCAAGTAACT AAAGGAGAAG TACTTTTAGA 60 

CGGTGTAAAT ATTTTAGAaT TAGAAGTTGA TGAAAGAGCA AAAGCAGGAT TATTCTTGGC 120 

AATGCAATAT CCATCAGAAA TTACAGGTGT TACAAATGCT GATTTCATGC GTTCAGCAAT 180 

10 

CAATGCGAAA CGTGAAGAAG GACAAGAAAT CAACTTAATG CAATTTATTA AGAAATTAGA 240 

TAAAAACATG GATTTTCTAG ACATAGATAA AGACATGGCA CAACGTTATT TAAATGAAGG 300 

TTTCTCAGGT GGAGAGAAGA AACGTAACGA AATCTTACAA TTAATGATGT TAGAACCTAA 360 

15 

GTTTGCaATC TTAGATGAAA TCGATTCAGG GTTAGACATC GATGCATTAA AAGTTGTATC 420 

TAAAGGTATT AACCAAATGC GTGGGGAAAA CTTTGGTGCA TTAATGATTA CACACTATCA 4 BO 

20 ACGATTATTA AATTACATTA CTCCTGATAA AGTACATGTA ATGTATGCTG GTAAAGTCGT 540 

TAAATCTGGT GGTCCAGAAT TAGCAAAACG TCTTGAAGAA GAAGGATATG AATGGGTTAA 600 

AGAAGAGTTC GGTTCAGCTG AATAATCTTA TTAATACAGT ATCCATGAGA TGTTCATCTA 660 

25 TATATGATGA AAATGAACAT TTATACGAAA TAGTAAATTT CATCAAGTAG GAGGAAAAAG 720 

TTATGACAAC TGATATTTTG rACaTTyCTG AAGAACAACT TGTTGATTAT TCTAAAGCCC 780 
ACAATGAACC TTCTTGGATG ACAGAATTAC GTAAAAAAGC TTTGAAATTA ACAGAAACTT 84 0 

30 

TAGAAATGCC AAAACCTGAT AAAACAAAAT TAAGAAAATG GGATTTTGAT TCTTTTAAAC 900 
AACACGATGT AAAAGGTGAT GTTTATCAAT CTTTATCACA ATTACCTGAG TCAGTAAGAG 960 

AAATTATTGA CGTAGATCAT TCTAAAAACT TAGTAATTCA ACATAATAAT ACGATTGCGT 1020 

35 

ACACACAAGT TGATGATAAT GCATCGAAAG ATGGCGTTAT CGTTGAAGGT TTAGCAGACG . 1080 

CTCTTATGAA CCATAGTGAT TTAGTACAAA AGTACTTTAT GAAAGATGCA GTAACAGTAG 1140 

ATGAACATCG TATCACAGCG CTACACACGG CATTAGTTAA TGGTGGCGTA TTTGTTTATG 1200 

40 

TTCCTAAAAA TGTAGTTGTA GAACATCCAG TACAATACGT TGTGTTGCAC GACGACGAAA 1260 

ATGCAAGCTT TTATAACCAT GTTATCATCG TTACTGAAGA 1300 
45 (2) INFORMATION FOR SEQ ID NO: 461: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3135 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
50 (D) TOPOLOGY: linear 
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GACAGCAAAT TCAAGATACA TTAAATAAAG 
ATAAATCTAA AAAGAGACCG CTAAATATTA 
AAATTTTAAA TGATGATTCA TTAGATATTA 
CTGTAGATTG GTTAAGAACA GCACTTAAAA 
ATTTATTAGC AGTACATCTT AAACTTTTAG 
TAAAGTTTGA AGCGAGTGTA GCAGGTGGTA 
TGAATGCGAA TAATATTTCA AAATTTATGG 
TATCTAAAAT GACTAAAGAG CAAACGACAT 
TTGGTTTTGC TGAAGCGGAT CCAACTGATG 
TTGTCATTAC ATCATATTTA TCATTTAACC 
GAGGAATTAG TGGCGTAACT TTAACTGATA 
TTAAATTGAT TGGTAAGGGA ATATATGAAA 
CGTTAATTGA TAAAAAGCAT CAATTAGCAG 
TTATTGGTGA TGCCGTTGGT GACACGATGT 
CAGGTAGTGC CGTTGTCAGT GATTTATTGA 
ACACATTGCC ACCACATTTT GAATTAAAGA 
ATGCAGAAAT TAATATTAAA GAAAAATCCA 
GTTCAATTGA AAATTTTGAA AATGAGTTAA 
GAGTTGCAAA TTACGATAAT CAATCATATG 
CGGAAGAATT AATCACTAAG CATGGATACG 
TTAATTATAA TGAGAAGATG GCAAGGATTA 
AATGAAAATA CACCAAAATT AACATTGAAC 
AATATGTCTA AAATACTAGG CATAGATTTA 
GTTCATTTAA AGATCGCGGT ATGGTAATGG 
AAATTGTAAT ATGCGCTTCG ACTGGAAATA 
GAGCAGGTTT AAAAGCTATC GTCGTAATAC 
CGCAAGCAGT AATGTATGGT GCAGAAATCG 
TAGAAATTGT AAAAGAAATT GCAAAAAGTG 
CATTTAGAAT CGAAGGACAA AAGACAGGCT 



ATATTGTCAT AAAGCATATT CTTGTTCGAG 
GCCAATATCA TTTAACTGAA GATGTTAATG 
TCGTTGAAGT CATGGGAGGA ATTGAACCAA 
ATAAAAAACA TGTTATTACC GCAAATAAAG 
AAGATTTAGC AGAAGAAAAT GGTGTAGCTT 
TTCCGATCGT AAATGCCATA AATAATGGTT 
GAATTTTAAA TGGTACCTCT AATTTTATTT 
TTGAGGAAGC ACTTGATGAA GCGAAAAGAC 
ATGTAGAAGG GGTAGATGCA GCGCGTAAAG 
AAGTCATTAA ATTAAACGAC GTTAAACGAA 
TTAATGTAGC CGATCAACTG GGGTATAAAA 
ATGGCAAAGT TAATGCATCG GTAGAACCAA 
CTGTAGAGGA TGAATATAAC GCGATTTATG 
TTTATGGAAA AGGAGCAGGC AGTTTAGCAA 
ATGTAGCATT ATTCTTTGAA TCAGATTTAC 
CAGATAAAAC ACGGGAAATG ATGGATTCAG 
ATTTCTTTGT AGTAGTGAAT CATGTCAAAG 
AGGCAATATT ACCATTTCAC CGATCATTAA 
CCGCTGTTAT AGTTGGATTG GAATCATCAC 
AATTGACAAA GTATACCCAG TAGAAGGAGT 
GTAGAAGAGT TTAAAGCACA TTTACCAGTA 
GAGGGAAATA CACCACTCAT TCATTGTGAA 
TATGTGaAGT ATGAAGGTGC CAATCCGACA 
CTGTGACAAA AGCAAAAGAG CAAGGTAAGA 
CATCAGCGTC TGCAGCAGCA TATGCAGCGA 
CAGAAGGTAA AATTGCATTA GGTAAATTGT 
TTTCTATTGA AGGAAACTTT GATGAAGCTT 
GCGAAATCGA GCTTGTAAAC TCTGTCAATC 
CATTTGAAAT TGTACAACAA TTAGACGGTG 
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5 



10 



15 



20 



35 



AAGGCTTTAA 


AGAATATCAT 


GAAGCTAAAG 


GATCACAATT 


GCCGAAAATG 


TTTGGCTTCC 


1860 


AAGCTGAAGG 


CGCATCACCA ATTGTTCAAA ATAAAGTCAT 


TAAAAATCCT GAAACGATTG 


1920 


CAACTGCTAT 


TCGAATTGGT 


AATCCTGCTA 


GTTGGGATAA 


GGCGACTAAT 


GCTCTTAAAG 


1980 


AATCAAATGG 


ATTAATAGAT 


AGTGTTACTG 


ATGATGAAAT 


TCTAGAAGCA 


TATCAGTTAA 


2040 


TGACAACTAA 


AGAAGGTGTC 


TTTAGTGAAC 


CAGCGAGTAA 


TGCTTCTATT 


GCAGGTTTAA 


2100 


TTAAATTGCA 


TAGACAAGGT 


AAATTACCTC 


AAGGTAAAAA AGTAGTTGCT ATTTTAACTG 


2160 


GTAATGGATT 


AAAAGATCCT 


GATACTGCTA 


TTTCACTACT AGATAATCCG ATAAAGCCAT 


2220 


TGCCAAATGA 


TAAAGATAGC 


ATTATCGATT 


ATATTAAAGG 


AGCTTTATAA 


CATGTCGAAT 


2280 


GTTTTGGAGT 


TAACAATTCC 


TGCATCAACA 


GCCAACCTTG 


GAGTTGGCTT 


TGATTCTATA 


2340 


GGTATGGCTT 


TAGATAAATT 


TTTGCATCTG 


TCTGTAAAGG 


AAACATCAGG 


GACAAAATGG 


2400 


GAATATATTT 


TCCATGATGA 


TGCATCTAAG 


CAATTGCCTA 


CTGACGAAAC 


AAACTTTATT 


2460 


TATCATGTAG 


CACAACAAGT 


TGCTTCTAAA 


TATAGTGTTG 


ACTTGCCTAA 


TTTATGTATC 


2520 


GAAATGAGAA 


GTGATATTCC 


ATTGGCAAGA 


GGGTTAGGTT 


CGTCAGCTTC 


TGCTTTAGTA 


2S80 


GGAGCTATAT 


ATATCGCAAA 


TTATTTTGGT 


GATATCCAAC 


TGTCTAAACA 


TGAGGTATTA 


2640 


CAATTAGCGA 


CTGAAATCGA 


AGGACATCCT 


GATAATGTTG 


CGCCGACCAT 


TTATGGTGGT 


2700 


TTAATCGCTG 


GATATTATAA 


TGATGTCTCG 


AAAGAAACGT 


CaGTtGCACA 


TATCGACATA 


2760 


CCAGACGTGG 


ATGTGATTGT 


AACGATACCA 


ACTTATGAAC 


TAAAAACAGA 


AGCATCAAGA 


2820 


CGTGCTTTAC 


CACAAAAATT 


AACACATAGT 


GAAGCGGTTA 


AAAGTAGTGC 


AATTAGTAAT 


2880 


ACAATGATTT 


tGgCATTAGC ACAGCACAAT TATGAATTAG CAGGTAAACT CATGCAACAA 


2940 


GATGGCTTTC 


ATGAACCGTA 


TCGTCAGCAT 


TTAATTGCTG 


AATTTGATGA 


AGTGAAAACA 


3000 


ATTGCTAGTC 


AACATAATGC 


CTATGCAACT 


GTAATTAGTG 


GTGCTGGACC 


AACTATTTTA 


3060 


ATATTTAGTC 


GTAAAGAAAA 


TAGTGGGGAA 


TTGGTTCGCT 


CTTTAAATAG 


TCAGGTAGTA 


3120 


TCATGCCATT 


CTGAA 










3135 


(2) INFORMATION FOR SEQ ID NO: 462: 









45 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1209 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

50 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 462: 
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AGnTCAATAT TTAGATCAAG CCGTTTTAAG TAATTACGAA CAAGTTTATA TCATTCATGG 120 

TAAAGGTACA GGTGCACTTC AAAAAGGTGT ACAACAACAT TTGAAAAAGC ATAAAAGTGT 180 

5 TAGTGACTTT AGAGGTGGTA TGCCAAGCGA AGGTGGATTT GGCGTTACCG TTGCAACACT 240 

AAAATAAATT ATAATTTGAT AAATTAAATA GCTGCAGTTA AAATAATGTA AAGCAACAAG 300 

AATACATTTC AAACATGTTA TTTGAAATAA GCATAAAAAT TGAGCAAATA GAAATACATG 360 

10 

AAGCATGTTA TCTGATATAA TTTGAACATC ATAATAATAA TTAAGGAGGA TTGGCATTTA 420 

TGGCAATCGT AAAAGTAACA GATGCAGATT TTGATTCAAA AGTAGAATCT GGTGTACAAC 480 

TAGTAGATTT TTGGGCAACA TGGTGTGGTC CATGTAAAAT GATCGCTCCG GTATTAGAAG 540 

15 

AATTAGCAGC TGACTATGAA GGTAAAGCTG ACATTTTAAA ATTAGATGTT GATGAAAATC 600 

CATCAACTGC AGCTAAATAT GAAGTGATGA GTATTCCAAC ATTAATCGTC TTTAAAGACG 660 

2Q GTCAACCAGT TGATAAAGTT . GTTGGTTTCC AACCAAAAGA AAACTTAGCT GAAGTTTTAG 720 

ATAAACATTT ATAAGTTACA ACCAATGACG ACTGGGGCAT TTCTTTAATG AATTGCTCCA 780 

GTTTTTGTTT GTGTTTTTAA TATAAAAAGT TGAATGATAA GTCATCATAT TGTTTACGAC 840 

25 TTGAGAATGG TGGGATTAAT AAATCTATGA ACGTTAAATG ATAATCTAGC ATGCTGATAG 900 

ATTTGTAGCA GTTGGTTTGA TAAAACCATG TTCAATATTA CATGATGTGC ATGAAAAGTC 960 

ATACTCGAAG ATGTTGATTA TTAACTAGAA TTAGTGGTGA TAAATTTGAA GCACTTTTGT 1020 

30 AGCATCATTC ATTTTAAAAT TAGAAGGGGG GATATTTTTG GAAGACTATA AGCAACGAAT 1080 

TAAAAATAAA TTAAATGTCG TACCTATGGA ACCAGGATGC TATTTAATGA AAGATCGTAA 1140 

TGATCAAGTG ATATATGTTG GCAAAGCTAA AAAGCTAAGA AATCGATTGC GATCATATTT 1200 

35 

TCACGGGTG 1209 

(2) INFORMATION FOR SEQ ID NO: 463: 

(i) SEQUENCE CHARACTERISTICS: 
40 (A) LENGTH; 2410 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

45 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 463: 
AGTTCAACAC GACGAATTTT ACCTGAGTTT GTTTTTGGTA AGTCGTCAAC GAATTCAATC 60 
SO TCTCTCGGAT ATTTATATGG TGCAACTTCA TTTTTAACAA ATTGTTGTAG TTCTTTAACT 120 

AACGTATCAT CACCCGCAGT ATGGTCCTGT AAAATAACGA ATGCTTTAAC AATATTTCCT 180 
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GCATCTTCAA 


CTTCAAAAGG 


CCCAATCGTA TAGCCTGAAC 


TAATAATAAT 


GTCATCTCGA 


300 




CGTCCTTCAA 


ACCAGAAATA 


ACCATCATCA 


TCTACATGAG 


CTAAGTCACC 


AGTGATGTAG 


360 


5 


TATTtACCTG 


TTTGCGCTTT 


CGCCGTACGT 


tCTGGCTCTT 


tATAATACCC 


TTTGAAAAGT 


420 




GCTGGCAAAT CAAGTGGTAC 


TGCAATATTC 


CCTTTCGTAT 


TAGCAGGTAC 


GCTATTCCCC 


480 


10 


TCATCATCTA 


CTACAGTGAC 


CGAACTACCC 


GGAATGCCTT 


TACCCATTGA 


TCCAATCCTC 


540 


TGTGGTGTAT CTTTTAAAAA GCCTATAAGC AAGGTACTTT CAGTCTGGCC ATATCCATCT 


600 




CTTACAGTTA 


AATTAAAGTA 


TTTCTTGAAT 


TGTTCAACTA 


CTTCTCGATT 


TAGTGGCTCA 


660 


15 


CCTGCAGAAA 


CGGCACTATG 


TAAATGCGTT 


AAGTCATAAT 


CATTTAAGTT 


CTGTAATTTA 


720 




GCCATCATAC 


GATATTCTGT 


CGGTGTACAA 


CATAAAACAT 


TAATTTGATA 


TTTTTGAAGC 


780 




AATTCTAAGT 


ATGTTTCAGG 


ACTGAACCTT 


CCATTAAATA 


CAAAAGCAGT 


TGCACCTGAA 


840 


20 


CCTAATACAG 


ATAAGAAAGG 


ACTCCATACC 


CATTTTTGCC 


AACCTGGTGC 


TGCTGTTGCC 


900 




CAAACTAAGT 


CATCTTCATT 


aATACATaAC 


CAATGTTTTG 


GTGCCATTTG 


TaAATGTGcA 


960 




AATCCCCaTC 


CATGACAATG 


TGTAACGGCT 


TTAGGATTGC 


CAGTTGTACC 


AGATGTATAT 


1020 


25 


GACAGAATCG 


CCATATCATC 


ACGCGTCGTA 


TCTGCCATTT 


CTAGTTTGTT 


ACTTGCGTTT 


1080 




TCTTTTTCAG 


CTTCAAGTGA 


AATCCATCCA 


TCTTTTTGAC 


CGGCAATAAC 


AAATTTAGTT 


1140 




AACGCATCAT 


ATTCTTTAAT 


TTTTTCAAAT 


TCAACTGTGA 


ATGGCTCTAG 


TGCAATAACT 


1200 


30 


GCATTAATTT 


CACCATGTGT 


GATACGGTAT 


TGTAAATCTT 


TAGTTCTTAG 


CATTTCAGAA 


1260 




CATGGAATGA 


TTGCAACACC 


TAATTTTAAA 


GCAGCAATAT 


ATAATTCATA 


CGTCGCAATA 


1320 




GATCGTGGCA 


TCATAATGAG 


TACTTTATCG 


CCTTTAGATA 


AACCGTGCGA 


TGCTAAAACA 


1380 


35 


TTACCTACTT 


TATTAGACTG 


TTCAATGAGC 


TGTTGGTAAG 


TGACTGATAT 


ATCTTCGCCT 


1440 




TCAGTATTAT 


GATATAAAAT 


TGCCTTTTTA 


TCTGGTATGT 


GGCTATATTT 


TTCGATTTCC 


1500 


40 


GAAATAATGT 


TATATTTTTC 


AGGCGCGAAT 


AGAGCTGACT 


TTTGCATAAC 


TAACTTCCTT 


1560 


TCATACATCC 


ACTTTTCCTG 


TGATGAACAT 


TGTAATTTTA 


TAAATGAATT 


ATATACATCA 


1620 




TACGCCTATC 


TTTACAGAAT 


TTTCAATTAA 


ATAGGGTTAA 


ATACCAAAGT 


CCTCGACACT 


. 1680 


45 


ACACTTTGAC 


ATGACGTAGC 


ATTCAAGGAC 


TTTCAAATGA 


TTGAGGGTTG 


ATATCTCGGG 


1740 




CTAGACCATA 


TCAGCTAATT 


CAATACGAAT 


ATTGTATGAT 


AATTCACGAT 


TAATTATTTT 


1800 




TACATCTGCA 


CCTTTCGAAG 


TGCCACGATG 


CTTGTGTGTA TGCTTGTACT 


CAGCTGAATT 


1860 


50 


TTGCCAATGA 


TAAAATGCTT 


GCCTATTTTC 


CCACAGCGTA ATAATGATAT AGTGTCTACC 


1920 




AGCTGTTCTA GGTCTTAAAA ACCTTAATGC TTTAAATCCA TCAACGTTTT TTAAATGCTT 


1980 
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ATTTAACACA CATAATGAAT CATTTGATAA ATCATTTATC GCTTCTAGCA CATCGTAATA 2100 

TGCAGTGTCA TTATTTTTTT GTATTGTGAG ACAATCATCC AGTTCTTCTA TTACATAACT 2160 

TCTATATTCA TCATAAATTT TCATAATAAA TGCCTTCATT TCATTTATAT TTTTGGTCAT 2220 

ATTACTkTAT ATCTATTACT AAtkCATTCC CGTATTTATT AATTACAATC ATAGTTTGGC 2280 

TyCTTTTTAA AAGATAAGAC TTTGTAAAAA GTATTAATAT TTCATGCAAA TGGGGGACAG 2340 

GAGTCGCCCA CTATTTTTGT GTCTTCAATT TCATGATCAT TATTTAACAT TAGTCATGAA 2400 

AATAGCCGAC 2410 
(2) INFORMATION FOR SEQ ID NO: 464: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 590 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 

so (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 464: 



25 



30 



35 



40- 



TTTATTAATT 


GTAAAAAATT 


GAGTAAATTA 


TCTTTACATT 


CTAAATTAGT 


CTTAACTACA 


60 


ACTAGTATCC 


TAATAATTAT 


AGGAGCTATT 


ACATTCTTTT 


TATTAGAACA 


GTTTAATACT 


120 


ATGCAACATA 


TGGGACTAGT 


TGAAAAAATC 


GGAAATTCTT 


TTTTCCAATC 


AGTAACAACA 


180 


CGAACAGCGG 


GTTTTAACAG 


TATAGATATA 


GCAAGCATTA 


rCAAATCTAC 


CGCATtAaTG 


240 


TTAATGCTAC 


TTATGTTTAT 


TGGTGGTGCC 


CCTCTCAGTG 


CAGCTGGAGG 


AATTAAAATA 


300 


ACTACTTTTG 


CAGTTGCGTT 


TATTTTTGTA 


CTAAATTATA 


kACGTAAAGA AAATAATGTT 


360 


TCAGTATTCA 


ATAAAGAAAT 


ATCTGACAAA 


CATATAAAAC 


TATCTATTGT 


TACCATTAAT 


420 


ATCTCATTTC 


TATTTATCAG 


CATCATTACT 


TTTATATTAT 


CGATAATTAA 


TCCGAACATA 


480 


TCATTAATCA 


AGTTATTATT 


CGAAGTGGTT 


TCTGCATTCG 


GAACAGTAGG 


GTTAAGTATG 


540 


AACCTTACCA 


CAGAATATCA 


TGGTATTACT 


AAAATAATTA 


TTATATTCGT 




590 



(2) INFORMATION FOR SEQ ID NO: 465: 

45 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 905 base pairs 
(BJ TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

50 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 465: 



55 
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TATTCGATTT GAnTCTTTTA AAATTATGTT TAAAAACATG TCTAATGATT CCGCATCATT 120 

TTTTGCACCA TCAATAAGCG TTTCAGcAAA CCCCTTAATT GAAGTAATAG GTGTTTTTAA 180 

5 TTCATGTGAA ACATTTGCTA CAAATTCACG TCTTAGATTT TCAAGTTGTT TCAGATTTGT 240 

TATATCATGC ATCACaACTA AAATCCCtTG CAAACTTTTT TGAGACCTAG TTAAAATCGG 300 

AACGCATGAA ATATCAAAGT ACTTGGCATG GACTTGGTTT ATTGCAACTT CCAATTGTTC 360 

10 

ATAAATAGGT TTTTCAACTT TAAAACTTTC TAAAATTAAT TGCTCAATTT CAGTATTAAC 420 

ATAGCCGTGA TAGCCTACTT GTTCAATATT ATGCGAGATG TTGAACTGTT CATAATACGC 4 80 

TTTATTTGCA ACAACGATTT TTCCATTTCG ATCTATCATT AAAATAGCAC TTGGAATATT 540 

15 

TTCAATCGTT GTTTTTAAAC GGTTGGATTG AATTTTTTGC TCATTATTAA GCTTTTGAAG 600 

GCGTCGTGCT AAATCATTGG TAGACACAAA AAGCGCTTTA GTTTCTACAA CATTACTTTC 660 

AGGTACACGT ATGTGATAAT AACCATTTGC CAACAATTGT GTTGCATAAG TAACTTCTTG 720 

20 

AATGGGACGG ATTAATGTAC GCTTAAAACT ACGGCTTGCA AAATACAGAC AAATGAGTAC 780 

AACTAAACAT GTCAAAATAA GATATTTCCA CAACGTCCAA TGCATTTCTG TAATATCGTT 84 0 

2S ATTGTAACCT TTAATCCATA CATGATAACC GTTAACCTTC TTATtAAAAA TAAAAACGTC 900 

CCTTT 905 
(2) INFORMATION FOR SEQ ID NO: 466: 

30 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1016 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

35 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 466: 

TTTGGTTAGC CCATAAAAGA AAAAAACAAG TAGTCATTTT TAAACAACAT ATCAAGTCTA 60 

40 

CCCAAGAAAT ACGTTTTGAC AAAGCGAAAG TGCTTGAACA CAAAGATGAA ATAGCAAATT 120 

TTATTTCTTT CGAACCACAA AGTTTTGAAT TTTATTATTT TACAGAATCG GAATTTTCAG 180 

AAGAACAATT AAATGAAGTT TCGCCAATTA GAATTAAATT CAATGTTATA AGACACACAA 240 

45 

AAGATTTGaT AAAGCATATG CCGAATATAT TTTTGGcTAG ACTTATTTCA GAAGATAATG 300 

ATAAAAAGAC ATATATGTTC TATAAACGCA AAGTATTAAC CGATAACTTT TTAG ATAAAT 360 

50 ATATGCAGAA ATTTTCACCG GCAACATACA CAATAATATT TGTAAATGTC TTAATATGGT 420 

TATGTATGAT TTTATATTTA AATAATTTTT CGGATGTAAA ATTATTAGAT GTTGGCGGGT 480 
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ATTTTAGTTT TGAACATATA CTTATGAATA TGCTTTCATT ATTTATTTTT GGTAAAATAG 
TCGAAGCAAT TATTGGTTCA TGGCGGATGT TAACTGTATA CTTTATTGCA GGGTTGTTTG . 
GAAACTTTGT ATCACTATCA TTTAATACGA CTACAATTTC AGTTGGGGCT AGTGGTGCTA 
TATTTGGTCT GATTGGATCA ATTTTTGCGA TGATGTATGT TTCAAAAACA TTTAACAAAA 
AAATGTTAGG ACAGTTATTA ATTGCATTAG TGATATTAGT TGGTGTTTCT CTGTTTATGT 
CAAATATAAA TATTGTGGCG CATATTGGAG GATTCATTGG TGGTTTATTA ATAACTTTAA 
TTGGCTATTA CTATAAAGTG AATCGtAATA TTTTTTGGaT TTaCtAATTG GTATGCtTGt 
tATATTTAwT GCACyTCmAA TTAgAtTTTT ACmATTAAAG AAGATAATAw TTATAA 
(2) INFORMATION FOR SEQ ID NO: 467: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4 06 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

' (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 467: 
AACTTTAAAT TTAGACATCT TTAAAACCTC TCTTAAACCA TGCCTATATC TCAAGATGAT 
ATTTCAAATG AACAATACTA TTGCTTGAGA CCATTAATGA ATGATCATAA ATATTTCTTT 
CTATAAAATT AGCTTTCCAA TAACTGTGTT GTTGCATAAT ATCATTCACA AGTACACCAT 
TTTCGGAAGT ATGATTATCT TTATCTATAC TTAAAACAAT TTGTTTAGTT TTAGCATGGC 
TAAATTGTTG AAGACCCTTA CACGATAAAC GTATAGCGTC TGAATTCTCA TTTAACAATG 
CGGCTGGgCA AACAAATGAC ACATTGTACT TCATGTTTGA ACtTCGTTAC AATCaTCGTG 
kCatTTTGat AAATAACAAT CCCTCGTAAT kGATTAAGTA TATTAT 
(2) INFORMATION FOR SEQ ID NO: 468: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1378 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 468: 
AGATAATACA CTTGAAGTTG GAATGGTTTG TGACGGTTAT TTAATGCGAA TTGAAAACTT 
AACACCATCA AATTTCTTCA ACTCAGCAAG TGAAGATACG ATTACTAAAA TTAAATTAAA 
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AGGTACAGCG TTAAAACTAA GAGAAGCCAT CAATTATGAT GAAATGGTTA TTGTAGATAG 240 

TATGACGTAG TTCCTAATTA TGCkAAAAGG GATTGATGAA AAACTGAAGG GCTTTTCATC 3 00 

5 AATCCCTTTT ATTTTAGGGG AATTGAATAG ATAGTTTTAA ACTATACGAA TTATTAATAT 360 

TTGAGATTTA ATTGAAATAA GTTTTAAAAA TTGGAGGAGA TAGATTAAGC GAAGTCATTT 420 

AAAGGTGAAG TTAAGTGTAT TCACAAAAAn TAGCCACACT CATATGACAT CGGATGAGTG 4 80 

10 

TGGCTTAAGG ATCTATGGGG GGAGGAAnCC ATAGATGTTT ACTTTGATAG GCCAGATTAA 540 

ATATCAAAGT ATGCGATTAT TTATAGCTTG ATGCAAAAGT GGTATGCCTA TTAAAAGTTA 600 

CTGCACATAG CTTTTAATAT TCCGTTCAAA GGAAAGGGGC ATACAATTGA ACAATCTGTA 660 

15 

ATAGTACTTT TAACCAGCTA TGCTAAAAGT CTAGTAGGGA GAACAGTTGT CCAATCACAT 720 

AAGAACCTCT AACTTCGTTA GTACGATTAA GAAAAGCTTT TTAGTTAGTA TGTAATACAA 780 

2Q TTTATTGACG CGCGTGAATC TCTTTTATAA GAGTGTGTAG GGAATGGCGT TGTATAAATT 840 

GTATTAGAAG AACTTCTAAC GCATCTCTGT GGTTAAAAGA GATGAAGGGA ACGACAGTTT 900 

aATTAAAACT GCATAAGAAC TTCTAGCTTT TCTCTCTCGT TCAAAGAGAA GCAGcTGTTC 960 

25 GCAGTTTAAT CAAAACCACA TAAAGCTTTT AACTTTACTC TTTGATTTAA AGAGTGATAA 1020 

ATGTTTACAG TTTAATTAAA ACTGCATAAG AACTTCTAGC TTTTCTCTTT CGTTCAAgAG 1080 

AAGCAGCTGT TCGCAgTTTA ATCAAAACCA CATAAAGCTT TTAACTTTAC TCTTTGATTT 1140 

30 AAAGAGTGAC AAATGTTTAC AGTTTAATTA AAACTGCATA AGAACTTCTA GCTTTTCTCT 12 00 

TTCGTTCAAA GAGAAGTTCT AATACCACCA TATCGTGCGA TCGGGAACGG TATATATATT 12 60 

AATAGGAGGG TAATATATAT TTAACGCACG ATATGGGACT ATTAGCCTTC GACTTTGTTA 1320 

35 

TGTTGATGTG TGGCCTAAAA TATTGGAGAT ACCAATATTT TAGGTTGCAT CAACATCA 13 78 

(2) INFORMATION FOR SEQ ID NO: 469: 

(i) SEQUENCE CHARACTERISTICS: 
40 (A) LENGTH: 4171 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

45 

(xi) SEQUENCE DESCRIPTION : SEQ ID NO: 4 69: 
TCCCAACCAA TAATCGTGGC AAAAATACGG ATATTGGTAT GGCTTAACAA ATTGCAAATA 60 
50 TCGTTTAATC ATACATCCCC CCTAATCTAT TGCCCTATCC TATTCaTAAG CATAAAAATG 120 

AATAGAGGTT GGATACATAA TTTGTAGATG TAAATTCTTC TTACAATTTA CATTTTTAAA '180 
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TTATATTCTA TTCAATTTAA TCTATGGATA CTGTGTCCCC ACACGACAGC AAAAGTTATC 300 

ATACTTCTTT ACATCACTAA GTCAATATAA ATGATTTAAT CAGTATTTAC ACTTTATTTG 360 

5 CTTAATACTG TCTAATTTTT TTGTAACGTT CTTTCCAAAC TTTGATAAAA TCTGGCGCGA 420 

ATGGGCCCTT CTTCTGTTCT ATCCATTGTT GAAGAATGTC CACGTTGCGT CTTAAAATAA 480 

TATCAATATC ATGCGGATAA TTCATTTGAT TCATATGTTG CTCATATTCA TCTTCATCTA 540 

10 

ATAAATGATA CTTTCCGTTT GGATATACTT TAATATCTAA ATCATAGTCT ATATATTTTA 600 

ATGCCTCTTC ATCACAAACA AATGGTGATG ACAAATTGCA ATAGTAATAA ATTCCATCTT 660 

CTCTAAACAT GCAGATAACA TTaAACCAAT ATTCTGAGTG AAAGTaAACA ATTGCCGGTT 720 

15 

CACGTGTTAT CCAAGTTCTT CCGTCACTTT CAGTCACTAA CGTATGATCA TTTCCACCAA 780 

TGACAACATG ATCAGTACCC TTTAATATTG TTGTTTCAGA CCAAACGCGA TGAATCTTAC 84 0 

20 CATCATGTTT ATAACTCTGA ATTTTAATGT TTTCCCCTTC TTTAGGTATG GATTCTCTGA 900 

CCATACTCCA CACCACCTTC TGTTAATTTA ACCATTATAA ATT AT AG CAT ATTTCAGAAA 960 

TAG T ATT AT A TAAATACATA TTTTTACGAA ATAAGATTTT ACTACTTAAT AATTAAACTC 1020 

25 GGTAATATTG CTAAGTACTA CAACAGAGAT TTACATGTCC CATTTAAAGT ATATAAAATC 1080 

ATCACTTTTA TATATCAACA CTTTAACTTT TTGACATTGT TATTCTATGA GATTTAAAGA 1140 

TATCATTTAT ACTTTTTAAA ATTAATGTCA CTATGTTTTC CGATAATATT ACCAATCATC 1200 

30 GAATGTTACC CATTTATAAA TTGATAAATs TTTGACATAG GTACAGGGAA TGTATATTGA 1260 

TCTCGATCAC TTAAATCAAA CCAAATCATG TCATCTGGTA ATGTTTCAAT GTTAATTGCT 1320 

CCTGAAACGG CGTATACTTT AATCTTCCAT GTTAAATGAG TAAATTGATG CTTCAACTCA 1380 

35 

AAAATAGGTG TTTCTACTGG TTGAATGTCA TGACCGATTT TTTCAGTCAT TTTACGTCTA 1440 

GCATGCTCAC TTTCAAACAT AGGAAATTGC CACATACCAT GCAATAATTT TTCGCTACGC 1500 

TTTTGCAACA GATATTGACC TTGATTATTT CTAATTAAAA AGACGGATTG CTCAATTACT 1560 

40 

TTTTTACTTA CATTTTTAGA TTTAACAGGT AACTTTTCAA ATGTACCTTT ATCAAATGCC 1620 

TCACAGTTTT CTTGAACTGG ACAAAATAAG CATAATGGAT TTTTTGGTGT ACAAATTAAC 1680 

GCCCCTAATT C CAT CAT AG C TTGATTAAAC GTTCCAGCTT CTGTAGTAAC ATACGGTAAT 1740 

45 

AATTCTTGTT CGTACGATTT CCTCGTCGAT TGTAATTTAA TATCTCGATA GTCATCATTC 1B00 

AATCTAGACC ATACTCGAAA AACATTTCCG TCTACAGTTG CTAGTGGTAC ATTATATGCA I860 

50 ATGCTCATTA CTGCAGCTTG TGTGTATGGG CCAACACCTT TTAACGCTTT AAATTGATCA 1920 

GGATCTTTGG GAACTAAGCC TTCATATTTA TCATGAACTT CTTTAATCGC CGTATGAAAA 1980 
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GCTTGaCTCA AAACTTCCAC AGTTGGAAAT 
ACTGTTTTAA CTTGTGTCTG TTGTAACATG 
5 GTCGTTTGTC GCCATGGCAT TTCTCTTTGA 

TTAAAACTAG ACTGCTGATA CATTTATAAA 
ACTCATAATG TTTTTATTGT ACATTAAAAT 

10 

TTGCGAAATT GGATTATAAT AGTATATATA 
ACTGCAACAC ATATCGCAAT TGGGGTGGGC 
ATGGCTTCTA CGTTTGGTGC AACAGCTACA 

75 

GGGGATACTG TTCTTAAATT AAAGGACAAT 
ACGCATTCCA TCCCTTTCAC AATACTATGG 

20 TTCTTTAGTG GAACCAACCC ATTTCATGTA 
CATGTCTTTG TAGATATATT CAATTCTTAT 
AAATGGATTC AATTAAGTGT GATTAACACA 

25 ATTGGTATTG TATTATGGGT TATAGGCTTG 
GCTTTACTAA TCATTTATTA CATGATTCGT 
GCTTTAAAAG CAATTCAACA AGAGCATCAC 

30 AAATTTATGG AATGGCGTGT CGCGATACAA 
TATGGTAGGA ATGTGGTGTT TAGTGATAAA 
ATTTTATGGA AAGTCAAAGG TAATAAAGAT 

35 

TATCGTTGGC AAACAACAAC GTTAGCAGAT 
CGTTATTTAA AAAATGATCA TTATTCATTT 
GTCATAGACC ACTCTTATAT TGGCTGGGTA 

40 

TATGCTAAAT AATTTCAAGT TATTATTCAC 
GGCAGAATGA AAATCAAAAC GATTTTTACT 
TGCTTTTACA AAATCTAAAA TTTATATTGT 

45 

TATCAAAATC AGTATAGGAA AACAATATCT 
CAGATTAATT TACACAACAG GTCAGCTAAA 
50 CTATCATTTG AAACATCCTG TTGATTATCa 
ATTGCGTGTG TCGTATACCT TGCTAATACG 



CGTTCAACAA AACGATGATA ATAGTCAATA 2100 

ACCTCACTTA ACCAAATATA GTACGGATTG 2160 

TTTTCATCAA ACCAGTGTAT CAAATTTTCT 2220 

ACCCTTTCCT CACCAAAATT AATTGTCTTT 2280 

CATGGTTAGT ATGTAAGTTA ATTTAGTTAT 2340 

ATATTATGAA ATGAGTGAAC TGATATGGAC 2400 

CTTACAGCAC TTGCAACTCA AGATCCAGCA 2460 

ACCCTTATCG TTGGTTCATT AATTCCTGAT 2520 

GCAACATATA TTTCGCATCA TAGAGGTATC 2580 

CCAATTTTAA TTACATTTTT AATATTCACG 2640 

TGGATGTGGG CTCAGCTCGC AGTATTTTTA 2700 

GGTACACAAG CGCTTAGACC TATCACAAAC 2760 

TTTGACCCTA TTATTTTCAC AGTTCTTTGT 2 820 

CATCCATTTG CAGTCTTCTT TCCTATAATC 2 880 

TTTAAAATGA GAGCCGTAAT TAAGCAACAA 2 940 

CCTGTTAAAG TATTTGTTGC GCCAACAATA 3000 

ACTGATGCAC ATGACTATGT TGGAAAAGCA 3060 

GTGGAACGTC AAACATTATC AACAGACTCC 3120 

ATACGTACTT TTTTAAACTT TTCATCAATC 3180 

GGTTCTACTG AAATTCGTTT GATTGATTTG 3240 

GTGGCAATTG CACATGTAAC AAACGATAAT 3300 

TTTACAGAAG ATAAGTTACA ACGTAAACTG 3360 

TAAAGTTAAT CTATAAAAAA TGAACAACCG 3420 

CTGTCCGGTT TTTTAATGTA AAACTATGAA 3480 

TGCTAACAAA CTACCTTTAA TGACTCGAAA 3540 

AGATGATATT CTAATTGTTT CTGATTCTCA 3600 

CATCATGAAG AAGTATCCGC CTCGTCTGTA 3.660 

GTTTGTGTCA CTTTAGATGT TTTATTaTAA 3720 

AAATTTACTG CAGCTATTAA ACATAAGAAT 3780 
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TGTGCTATAC CATTAACAAT GTAATACATT GGATTTAGCA TTAGGATGTG ATTGATAAAT 3900 

ACATGATTTG GATTTGGTAT GAAAATAATT GGTAACAATA AGAAACACAA TACACAAACC 3960 

5 CCATAAAATA TGATATTTAT TTTTTCAGwT AACAGTCGAA TAAGACCAAA AGTAACGGAT 4020 

ATTAATCCTA CAAAAATAGT TGCCATCACA ATAAAATAGA ATAGCGCTAT ATATGATGTT 4080 

TCGAAGTTTA CTGGTTTAAC CAATGCACTA ATCATCGTCA AAATGACTAG CATAATAAAA 4140 

10 

CTTAAAATAG ACATAATAAC TACTGGCGTC G 4171 

(2) INFORMATION FOR SEQ ID NO: 470: 

(i) SEQUENCE CHARACTERISTICS: 
,5 (A) LENGTH: 9821 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

20 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 470: 
TGGTTGAAGT AGCAGTTAAT TCAAAATCTG CAACAGTTTC AGCAGAATaG GGGCTTTCAA 60 

25 AATAAtCAAA GGAGAATAAT TTATGACTAA AACTTTAAAG GTTTATAAAG GAGACGACGT 120 

CGTAGCTTCT GAACAAGGTG AAGGCAAAGT GTCAGTAACT TTATCTAATT TAGAAGCGGA 180 
TACAACTTAT CCAAAAGGTA CTTACCAAGT GGCATGGGAA GAAAATGGTA AAGAATCTAG 240 

30 TAAAGTTGAT GTACCTCAAT TCAAAACCAA TCCAATTCTA GTCTCAGGCG TATCATTTAC 300 

ACCAGAAACT AAATCAATTA TGGTAAATAC CGATGACAAT GTTGAGCCAA ACATTGCACC 360 
AAGCACAGCA ACGAATAAAA TATTGAAATA TACAAGTGAA CATCCAGAAT TTGTTACTGT 420 

35 

AGATGAAAAT ACAGGAGCAA TTCACGGTGT AGCTGAAGGT ACTTCAGTAA TCACTGCTAC 4 80 

GTCTACTGAT GGAAGCGATA AGTCAGGACA AATTTCAGTG ACAGTAACAA ACGGATAGGG 540 
ATTTAAGGCG CAGTATATCT GCGTCTTTTT TATTTGAATA AAAGGAGCTA ATACAATGAT 600 

40 

TAAATTTGAA ATTAAAGATC GTAAAACAGG AAAAACAGAG AGCTATACAA AAGAAGATGT 660 
AACAATGGGC GAACAGAAAA ATGCTATGAG TATTTAGAAT TAGTAAATCA AGAGAATAAA 720 
AAAGAAGCAC CTAACGCAAC AAAAATGAGA CAAAAAGAGC GACAGTTATT AGTAGATTTA 780 

45 

TTTAAAGATG AAGGATTGAC TGAAGAAGAT GTTCTGAACA AGATGAGTAC TAAAACTTAT 840 
ACAAAAGCCT TACAAGATAT ATTTCGAGAA ATCAATGGTG AAGATGAAGA AGATTCAGAA 900 
50 ACTGAACCAG AAGAGATGGG AAAGACAGAA GAACAATCTC AATAAAAGAC ATTTTATCGA 960 

ACATTAAGAA AATACAACGT TTCTGTATGG AGCAGTATGG GTGGACATTA ACTGAAGTCA 1020 

55 



1387 



JO 



15 



EP0 786 519 A2 

AAGAAAAACA AAGTGAACAA AAAGTCATTA CAGGTACGGA TTTAAGAAAA CTTTTTGGAA 1140 

GCTAGAAAGG AGGTTAATAT GAATGAAAAA GTAGAAGGCA TGACCTTGGA GCTGAAATTA 1200 

GACCATTTAG GTGTCCAAGA AGGCATGAAA GGTTTAAAGC GACAATTAGG TGTTGTTAAT 1260 

AGTGAAATGA AAGCTAATCT GTCAGCATTT GATAAGTCTG AAAAATCAAT GGAAAAATAT 1320 

CAGGCGAGAA TTAAGGGGTT AAATGATAGG CTTAAAGTTC AAAAAAAGAT GTATTCTCAA 1380 

GTAGAAGATG AGCTTAAACA AGTTAACGCT AATTACCAAA AAGCTAAATC CAGTGTAAAA 1440 

GATGTTGAGA AAGCATATTT AAAGTTAGTA GAAGCCAATA AAAAAGAAAA ATTAGCTCTT 1500 

GATAAATCTA AAGAAGCCTT AAAATCATCG AATACAGAAC TTAAAAAAGC TGAAAATCAA 1560 

TATAAACGTA CAAATCAACG TAAACAAGAT GCGTATCAAA AACTTAAACA GTTGAGAGAT 1620 

GCAGAACAAA AGCTTaAGAA TAGTAACCAA GCTACTACTG CACAACTAAA AAGAGCAAGT 1680 

20 GACGCrtACA GAAGCAGTCC GCTAAGCATA AAGCACTTGT TGAACAATAT AAACAAGAAG 1740 

GCAATCAAGT TCAAAAACTA AAAGTGCAAA ATGACAATCT TTCAAAATCA AATGATAAAA 1800 

TTGAAAGTTC TTACGCTAAA ACTAATACTA AATTAAAGCA AACAGAAAAA GAATTTAATG 1860 

25 ATTTAAACAA TACTATTAAG AATCATAGCG CTAATGTCGC AAAAGCTGAA ACAGCTGTTA 1920 

ATAAAGAAAA AGCTGCTTTA AATAATTTGG AGCGTTCAAT AGATAAAGCT TCATCCGAAA 1980 

TGAAGACTTT TAACAAAGAA CAAATGATAG CTCAAAGTCA TTTCGGTAAA CTTGCAAGTC 2040 

AAGCGGATGT CATGTCAAAG AAATTTAGTT CTATTGGAGA CAAAATGACT TCCCTGGGAC 2100 

GTACAATGAC GATGGGCGTA TCTACACCGA TTACTTTAGG TTTAGGTGCA GCATTAAAAA 2160 

CGAGTGCAGA CTTTGAAGGG CAAATGTCTC GAGTTGGAGC GATTGCACAA GCAAGCAGTA 2220 

AAGACTTAAA AAGCATGTCT AATCAAGCGG TTGACTTAGG AGCTAAAACA AGTAAAAGTG 2280 

CTAACGaAGT TGCTAAAGGT ATGGAAGAAT TGGCAGCTTT AGGCTTTAAT GCCAAACAAA 2340 

CAATGGAGGC TATGCCAGGT GTTATCAGCG CAgcAGaAGC AAGTGGTGCA GAAATGGCTA 24 00 

CAACTGCAAC TGTAATGGCT TCAGCGATTA ACTCTTTCGG TTTAAAAGCA TCTGATGCAA 2460 

ATCATGTTGC TGATTTACTT GCGAGATCAG CAAATGATAG TGCTGCAGAT ATTCAATATA 2520 

TGGGAGATGC ATTAAAATAT GCAGGTACTC CAGCAAAAGC ATTAGGAGTT TCAATAGAGG 2580 

ACACTTCTGC AGCAATTGAA GTTTTATCTA ACTCAGGTTT AGAGGGGTCT CAAGCAGGTA 2640 

CTGCATTAAG AGCTTCGTTT ATTAGGCTAG CTAATCCAAG TAAAAGTACA GCTAAGGAAA 2700 

50 TGAAAAAATT AGGTATTCAT TTGTCTGATG CTAAAGGTGA GTTTGTTGGA ATGGGCGAAT 2760 

TGATTAGACA GTTCCAAGAT AACATGAAAG GCATGACGAG AGAACAAAAA TTAGCAACAG 2820 
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CAGATAAAAT TAATAGCTAT AGCAAATCAT TGAAGAACTC TAATGGTGAA AGTAAAAAAG 2940 

CAGCTGATTT GATGAAAGAT AACCTCAAAG GTGCTCTGGA ACAATTAGGT GGCGCTTTTG 3000 

5 

AATCGTTAGC AATTGAAGTT GGTAAAGATT TAACGCCTAT GATTAGAGCA GGTGCGGAAG 3060 

GATTAACAAA ATTAGTTGAT GGATTTACAC ATCTTCCTGG TTGGGTTAGA AAGGCTTCGG 3120 

TAGGCTTAGC AATTTTTGGT GCATCTATTG GTCCTGCTGT TCTTGCTGGT GGCTTATTAA 3180 

10 

TACGTGCAGT TGGGAGCGCG GCTAAAGGCT ATGCATCATT AAATAGACGC ATTGCTGAAA 3240 

ATACAATTCT TTCTAATACC AATTCAAAAG CAATGAAATC TTTAGGTCTT CAAACATTAT 3300 

15 TTCTTGGTTC TACAACAGGA AAAACGTCAA AAGGCTTTAA AGGATTAGCC GGAGCTATGT 3360 

TGTTTAATTT AAAACCTATA AATGTTTTGA AAAATTCTGC AAAGCTAGCA ATTTTACCGT 3420 

TCAAACTTTT GAAAAACGGT TTAGGATTAG CCGCAAAATC CTTATTTGCA GTAAGTGGAG 34 80 

2 Q GCGCAAGATT TGCTGGTGTA GCCTTAAAGT TTTTAACAGG ACCTATAGGT GCTACAATAA 3540 

CTGCTATTAC AATTGCATAT AAAGTTTTTA AAACCGCATA TGATCGTGTG GAATGGTTCA 3600 

GAAACGGTAT TAACGGTTTA GGAGAAACTA TAAAGTTTTT TGGTGGCAAA ATTATTGGCG 3 660 

25 GTGCTGTTAG GAAGCTAGGA GAGTTTAAAA ATTATCTTGG AAGTATAGGC AAAAGCTTCA 3720 

AAGAAAAGTT TTCAAAGGAT ATGAAAGATG GTTATAAATC TTTGAGTGAC GATGACCTTC 3780 

TGAAAGTAGG AGTCAACAAG TTTAAAGGAT TTATGCAAAC CATGGGCACA GCTTCTAAAA 3840 

30 AAGCATCTGA TACTGTAAAA GTGTTGGGGA AAGGTGTTTC AAAAGAAACA GAAAAAGCTT 3900 

TAGAAAAATA CGTACACTAT TCTGAAGAGA ACAACAGAAT CATGGAAAAA GTACGTTTAA 3960 

ACTCGGGTCA AATAACAGAA GACAAAGCAA AAAAACTTTT GAAAATTGAA GCGGATTTAT 4020 

35 

CTAATAACCT TATAGCTGAA ATAGAAAAAA GAAATAAAAA GGAACTCGAA AAAACTCAAG 4080 

AACTTATTGA TAAGTATAGT GCATTCGATG AACAAGAAAA GCAAAACATT TTAACTAGAA 4140 

CTAAAGAAAA AAATGACTTG CGAATTAAAA AAGAGCAAGA ACTCAATCAG AAAATCAAAG 4200 

40 

AATTGAAAGA AAAAGCTTTA AGTGATGGTC AGATTTCAGA AAATGAAAGA AAAGAAATTG 4260 

AAAAGCTTGA AAATCAAAGA CGTGACATCA CTGTTAAAGA ATTGAGTAAG ACTGAAAAAG 4320 

45 AGCAAGAGCG TATTTTAGTA AGAATGCAAA GAAACAGAAA TGCTTATTCA ATAGACGAAG 43 BO 

CGAGCAAAGC AATTAAAGAA GCAGAAAAAG CAAGAAAAGC AAGAAAAAAA GAAGTGGATA 4440 

AGCAGTATGA AGATGATGTC ATTGCTATAA AAAATAACGT CAACCTTTCT AAGTCTGAAA 4500 

SO AAGATAAATT GTTAGCTATT GCTGATCAAA GACATAAGGA TGAAGTAAGA AAGGCAAAAT 4 560 

CTAAAAAAGA TGCTGTAGTA GACGTTGTTA AAAAGCAAAA TAAAGATATT GATAAAGAAA 4620 
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GTTGGTGGTC TAACTTTAGA GAAGACCAAA AGAAGAAAAG TGATAAATAC GCTAAAGAAC 4740 

AAGAAGAAAC AGCTCGTAGA AACAGAGAAA ATATAAAGAA ATGGTTTGGA AATGCTTGGG 4 800 

5 ACGGCGTAAA AACTAAAACT GGTGAAGCCT TTAGTAAAAT GGGCAGAAAT GCTAATCATT 4860 

TTGGCGGCGA AATGAAAAAA ATGTGGAGTG GAATCAAAGG AATTGCAAGC AAATTAAGTT 4 920 

CAAGTTGGAG CTCAGCCAAA AGTTCTGTAG GATATCACAC TAAGGCTATA GCTAATAGTA 4 980 

10 

CTGGTAAATG GTTTGGAAAA GCTTGGCAAT CTGTTAAATC GACTACAGGA AGTATTTACA 5040 

ATCAAACTAA GCAAAAGTAT TCAGATGCCT CAGATAAAGC TTGGGCGCAT TCAAAATCTA 5100 

TTTGGAGAGG CACATCAAAA TGGTTTAGCA ACGCATATAA AAGTGCAAAG GGTTGGCTAA 516 0 

15 

TAGATATGGC TAATAAATCG CGCTCGAAAT GGGATAATAT TTCTAGTACA GCATGGTCGA 5220 

ATGCAAAATC CGTTTGGAAA GGAACATCGA AATGGTTTAG TAACTCATAC AAATCTTTAA 5280 

2Q AAGGTTGGAC TGGGGATATG TATTCAAGAG CCCACGATCG TTTTGATGCA ATTTCAAGTT 534 0 

CGGCATGGTC TAACGCTAAA TCAGTATTTA ATGGTTTTAG AAAATGGCTA TCAAAAACAT 5400 

ATGATTGGAT TAGAGATATT GGTAAAGACA TGGGAAGAGC TGCGGCTGAT TTAGGTAAAA 5460 

25 ATGTTGCTAA TAAAGCTATT GGCGGTTTGA ATAGCATGAT TGGCGGTATT AATAAAATAT 5520 

CTAAAGCCAT TACTGATAAA AATCTCATCA AGCCAATACC TACATTGTCT ACTGGTACTT 5580 

TAGCAGGAAA GGGTGTAGCT ACCGATAATT CAGGAGCATT AACGCAACCG ACATTTGCTG 564 0 

30 TATTAAATGA TAGAGGTTCT GGAAACGCCC CAGGTGGTGG AGTTCAAGAA ATAATTCACA 5700 

GGGCTGACGG AACATTCCAT GCACCCCAAG GACGAGATGT GGTTGTTCCA CTAGGAGTTG 5760 

GAGATAGTGT AATAAATGCC AATGACACTC TGAAGTTACA GCGGATGGGT GTTTTGCCAA 5820 

35 

AATTCCATGG TGGTACGAAA AAGAAAAAAT GGATGGAACA AGTTACTGAA AATCTTGGTA 5880 

AAAAAGCAGG GGACTTCGGT TCTAAAGCTA AAAACACAGC TCATAATATC AAAAAAGGTG 5940 

CAGAAGAAAT GGTTGAAGCG GCAGGCGATA AAATCAAAGA TGGTGCATCT TGGTTAGGCG 6000 

40 

ATAAAATCGG CGATGTGTGG GATTATGTAC AACATCCAGG GAAACTAGTA AATAAAGTAA 6060 

TGTCAGGTTT AAATATTAAT TTTGGAGGCG GACTAACGCT ACAGTAAAAA TTGCTAAAGG 6120 

45 CGCGTACTCA TTGCTCAAAA AGAAATTAGT AGACAAAGTA AAATCGTGGT TTGAAGATTT 6180 

TGGTGGCGGA GGCGATGGAA GCTATCTATT TGACCATCCA ATTTGGCAAA GGTTTGGGAG 6240 

TTACACAGGT GGACTTAACT TTAATGGCGG TCGTCACTAT GGTATCGACT TTGGTATGCC 6300 

50 TACAGGAACG AACATTTATG CTGTTAAAGG CGGTATAGCT GATAAAGTAT GGACTGATTA 6360 

CGGTGGCGGT AATTCTATAC AAATTAAGAC CGGTGCTAAC GAATGGAACT GGTATATGCA 6420 
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ATCAGGTGCT ACAGGTAATT TCGTTAGAGG AGCACACTTA CATTTCCAAT TGATGCAAGG 654 0 

GTCGCATCCA GGGAATGATA CAGCTAAAGA TCCAGAAAAA TGGTTGAAGT CACTTAAAGG 6600 

TAGTGGCGTT CGAAGTGGTT CAGGTGTTAA TAAGGCTGCA TCTGCTTGGG CAGGCGATAT 6660 

ACGTCGTGCA GCAAAACGAA TGGGTGTTAA TGTTACTTCG GCTGACGTAG GAAATATCAT 6720 

TAGCTTGATT CAACACGAAT CAGGAGGAAA TGCAGGTATA ACTCAATCTA GTTCGCTTAG 6780 

AGACATCAAC GTTTTACAGG GCAATCCAGC AAAAGGATTG CTTCAATATA TCCCACAAAC 6840 

ATTTAGACAT TATGCTGTTA GAGGTCACAA CAATATATAT AGTGGTTACG ATCAGTTATT 6900 

AGCGTTCTTT AACAACAGAT ATTGGCGCTC ACAGTTTAAC CCAAGAGGTG GTTGGTCTCC 6960 

AAGTGGTCCA AGAAGATATG CGAATGGTGG TTTGATTACA AAGCATCAAC TTGCTGAAGT 7020 

GGGTGAAGGA GATAAACAGG AGATGGTTAT CCCTTTAACT AGACGTAAAC GAGCAATTCA 7080 

20 ATTAACTGAA CAGGTTATGC GCATCATCGG TATGGATGGC AAGCCAAATA ACATCACTGT 714 0 

AAATAATGAT ACTTCTACAG TTGAAAAATT GTTGAAACAA ATTGTTATGT TAAGTGATAA 7200 

AGGAAATAAA TTAACAGATG CGTTGATTCA AACTGTTTCT TCTCAGGATA ATAACTTAGG 7260 . 

TTCTAATGAT GCAATTAGAG GTTTAGAAAA AATATTGTCA AAACAAAGTG GGCATAGAGC 732 0 

AAATGCAAAT AATTATATGG GAGGTTTGAC TAATTAATGC AATCTTTTGT AAAAATCATA 7380 

GATGGTTACA AGGAAGAAGT AATAACAGAT TTTAATCAGC TTATATTTTT AGATGCAAGG 744 0 

GCTGAAAGTC CAAACACCAA TGATAACAGT GTAACTATTA ACGGAGTAGA TGGTATTTTA 7500 

CCGGGCGCAA TTAGTTTTGC GCCTTTTTCA TTAGTATTAA GGTTTGGCTA TGATGGTATA 7560 

GATGTTATAG ATTTAAATTT ATTTGAGCAT TGGTTTAGAT CTGTGTTTAA TCGCAGACAT 7620 

CCTTATTATG TTATTACTTC TCAAATGCCT GGTGTTAAAT ATGCAGTGAA TACAGCTAAT 7680 

GTTACATCTA ATTTAAAAGA TGGTTCTTCA ACTGAAATTG AAGTAAGTTT AAATGTTTAT 7740 

40 AAAGGGTATT CTGAATCAGT TAATTGGACC GATAGCGAGT TCTTATTCGA CTCTAATTGG 7800 

ATGTTTGAAA ATGGAATTCC TCTTGATTTC ACACCTAAAT ATACTCATAC ATCAAATCAA 7860 

TTTACTATTT GGAACGGTTC TACTGATACG ATAAATCCAC GATTCAAGCA CGATTTGAAA 7920 

ATATTAATTA ATTTAAATGC GAGTGGAGGA TTTGAACTGG TTAATTATAC AACAGGTGAT 7980 

ATTTTTAAGT ACAACAAAAG TATAGATAAA AACACTGATT TTGTTTTAGA TGGTGTGTAT 8040 

GCATATCGAG ATATAAACAG AGTGGGAATT GATACAAATA GAGGCATTAT AACATTAGCG 8100 

CCAGGTAAAA ATGAATTTAA GATTaAAGGA GACGTCAGTG ATATTAAAAC TACATTTAAG 8160 

TTTCCTTTTA TTTATAGGTA GGTGATTTAA TGGATTATCA TGATCATTTA TCAGTAATGG 8220 
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ATTATGAACT 


GAATGAAGCT 


AGGTACATCA 


CCTTTACAGT 


TTATAGAACT 


ACTCATAATA 


8340 




GTTTTGTTTT 


TGATTTATTG 


ATTTGTGAAA 


ACTTCATAAT 


TTATCATGGT 


GAAAAATACA 


6400 


£ 


CAATTAAGCA 


GACAGCGCCA 


AAGGTTGAAG 


GTGATAAAGT 


TTTTATTGAA 


GTTACGGCAT 


8460 




ATCACATAAT 


GTATGAATTT 


CAAAATCACT 


CAGTGGAATC 


AAATAAGCTT 


GATGACGACA 


8520 


10 


GTAGCGAAAC 


TGGTAAAACG 


CCAGAATACT 


CTTTAGATGA 


GTACTTAAGA 


TATGGATTTG 


8580 


CAAATCAAAA 


AACGTCAGTC 


AAGATGACCT 


ATAAAATAAT 


TGGAGATTTT 


AAAAGAAAAA 


8640 




TACCAATTGA 


TGAATTAGGT 


AATAAAAATG 


GCTTAGAATA 


TTGTAAAGAA 


GCAGTAGATT 


8700 


IS 


TGTTTGGTTG 


TATTATTTAT 


CCAAATGATA 


CGGAGATATG 


TTTTTATTCT 


CCTGAAACAT 


8760 




TCTATCAAAG 


AAGCGAAAAA 


GTAATAAGGT 


ATCAATATAA 


TACTGATACT 


GTGTCTGCTA 


8820 




CTGTCAGTAC 


GTTGGAATTA 


AGAACAGCTA 


TAAAAGTTTT 


TGGGAAAAAG 


TACACAGCCG 


8880 


20 


AGGAAAAGAA 


AAATTATAAT 


CCTATTAGAA 


CAACTGACAT 


TAAATATTCA 


AATGGTTTTA 


8940 




TAAAAGAAGG 


TACTTATCGT 


ACCGCAACAA 


TTGGGTCTAA 


AGCTACTATT 


AACTTTGATT 


9000 




GCAAGTATGG 


TAATGAAACA 


GTTAGATTTA 


CAATAAAaAA 


GGGCTCTCaA 


GGTGGAATAT 


9060 


25 


ATAAGTTGAT 


TTTAGACGGC 


AAGCaAATTA 


AGCaAATTTC 


TTGTTTTGCT 


AAGTCGGTTC 


9120 




AGTCTGAmAC 


AATAGATTTA 


ATAaAAAATA 


TTGATAAAGG 


CAAGCACGTT 


TTAGAAATGA 


9180 


30 


TATTTTTrGG 


AGArGrCCCC 


AAAAATAGAA 


TTGATATATC 


TTCAAATAAA 


AAAGCTAAGC 


9240 


CTTGTATGTA 


TGTTGGAACT 


GAAAAATCAA 


CAGTCTTAAA 


TTTAATTGCT 


GACAACTCAG 


9300 




GTCGCAATCA 


ATACAAAGCA 


ATTGTTGaCT 


ACGTCGCAGA 


TAGTGCAAAG 


CAGTTTGGGA 


9360 


35 


TTCGATATGC 


TAATACGCAA 


ACAAATGAAG 


ATATCGAAAC 


ACAGGATAAG 


CTGTTAGAAT 


9420 




TTGCAAAAAA 


GCAAATAAAT 


GATACTCCTA 


AGACTGAATT 


AGATGTTAAT 


TATATAGGTT 


9480 




ATGAAAAAAT 


AGAGCCAAGA 


GATAGCGTAT 


TCTTTGTTCA 


TGAATTAATG 


GGATATAACA 


9540 


40 


CTGAATTAAA 


GGTTGTTAAA 


CTTGATAGGT 


CACATCCATT 


TGTAAACGCA 


ATAGATGAAG 


9600 




TGTCTTTCAG 


CAATGAAATA 


AAGGATATGG 


TACAAATTCA 


ACAAGCGCTT 


AACAGACGAG 


9660 




TTATTGCACA 


AGATAATAGA 


TATAACTATC 


AAGCAAATCG 


TATAAATCAT 


TTATACACTA 


9720 


45 


GTACTTTGAA 


TTCTCCTTTC 


GAGACAATGG 


ATATAGGGAG 


TGTATTAATA 


TAATGGCAAC 


9780 




AGAAGAAGTT 


AAAATCAAAG 


CGCTACTTGA 


AAACGATAAA 


C 




9821 



(2) INFORMATION FOR SEQ ID NO: 471: 

50 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1017 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
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(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 471: 
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30 



TTATTGTTTT 


CCAAATGGTC 


TTCTCGGTTA 


TTTAACCATC 


GGTTTCAATC 


CTACGTGCTT 


60 


CACTTTCTAT 


CtATTAATTC 


AaTTTCAGCT 


TGACCACCCG 


CTGTATAAAG 


GGTCAAAGTT 


120 


GCTAATCGAT 


AGCGTCTCAT 


TATAGGACCA 


ACATCGATAT 


CAATATTTTG 


AATACGAAAA 


180 


TATGGTATTA 


CCTTTTCATC 


CAAAAATAAA 


ATGCCGTTTC 


GTACACGCAA 


ATGGTGTTTT 


240 


TCAAATGCAT 


ATCTGCAGTG 


CTTATATCGA 


TAGACTGGCG 


CTATAACAAG 


CGTGAAAACA 


300 


GCAACAAGTA 


ATATTATAAT 


CACACTACTA 


ACAATGGATA 


AATGGTTATC 


TAAAATCTCC 


360 


CAAAATAGCC 


AGTTCAAAAT 


ATTAAATGCG 


ATTAAAAGTA 


CAAGCGCTAT 


GGGTATCCAA 


420 


AACAGCACAG 


CACTTAACCT 


CATCACTTTT 


TTAGCGTGTG 


GTGACATAAA 


ATTATAATCC 


480 


CTCATCATTT 


TCACCTCTTA 


AATACCATGA 


TTTCAATTTA 


TTTGCATCTT 


CACTTCTTGC 


540 


GTATTTTAAG 


TTAATCGATT 


GGGCTCCCAC 


AC CTTT AG CA 


ACAATAAAGC 


TAAAATTATT 


600 


TAAATTGTTG 


CGTTTAAGTA 


ATGTATGTTG 


CCAAGTGTCA 


AATCCTATAA 


TGTGATGCGC 


660 


TTTAAAATAA 


TAAATATTTC 


GTTTCAATAG 


CTCGAAATTC 


TGGATAGTAA 


TTTGTTCTTC 


720 


TGTCATTTTA 


AAACCCGCAT 


GTTTGACATA 


AAGATATCCT 


TTGATCACAA 


ATAAACCAAT 


780 


AATGACTATT 


GTTATAATCG 


TAAATAACAA 


TAATAATTGA 


TTCCAAAAAT 


AACAGCCTAT 


640 


ACCTGCCATA 


GCTATGACAA 


TAATACTAGG 


TATTAAAAAG 


TGTCTGTGGA 


AACCTGACAA 


900 


AGGCATACCT 


TCATTAACTT 


GTTGATAAGA 


TAAATCTGGT 


ACTAAATTCT 


GGATAATTTG 


960 


ATATGCTTTG 


TCTCGTTTAA 


TAAACGGCaA 


TATCGGCACA 


CTACCTGAAT 


CATTGTC 


1017 



35 (2) INFORMATION FOR SEQ ID NO: 472: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6806 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 472: 

45 

TAGGATTGAT TAATCCTTTC TTCAAAATGA TGAATGTGTA ATGTTAAATA TATAATTTCA 60 
GACTCACTGA TATTAACATC AAATTGTTTT TGTATCATAG TTAAAATTTT ATATGCTGTG 120 
SQ TTATAGCAAA TCGGATAGTG ATTTTTAATC ATAGACACAA AATCATCTTG TGCATGTATA 180 

TATTCTTTTC TTCTTAATCG GCGAATTAAA AATTGTACGT GCCTTATAAA ACGTTGGTAT 24 0 
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TTAATAACAT TATTnGATCA AGGTCATCTC ATGCATAGAT AAATCTTCTG TATTaGATGC 360 

AATATGTAAT GCAATAAATC CTATCTCATC TTCAGGaAAA TGTaCATCTA ATGCTGCATT 420 

TAACTGATCA ATCACCTGTT TAGCAATATG ATATGCATCA CTATATAACT GCATAGTTTC 480 

CATAACAAAT GGATTGCTAA TAACTTGATT TTGTTTTAAG CGTTTATAAG CAAATATAAT 540 

ATGATCCGTT AATGAAACTA CAAGTTGTTT TGAATCAACA TTCATCGCAG TATTAGAAAT 600 

AAAATTCAAC GAATCAATAA TTACTTGTAA TACATTATCA TCAGCGATTT CAACTAAACT 660 

TTTATAATGT GCTTTTTGTT GCTCACTTTC TAATTTATAA ATTTTCTCTA TTGTAATAGT 720 

TTGGTCGTTT AACGCCATTC CCTCTTTTTT GTTAAAACCA ATACCTTTAC CGATTAAAAT 780 

AACTTCTTGA TCATTATTAG TACATACTAC GACATTGTTG TTCAATGTTT TAGTAACAAT 840 

ATATTCTCCC ATTATCATCA CCTATTTTTC TATTATTAAG ATTATATATC GGAAATGTCT 900 

AACTTGAAAG TATAATAATT TAAATACTTG TGTTCTATTA CACGCCTATC CTATATGATA 960 

TATCTTAATT TAATTTCGAT GTCTCTCAAA GTGGAATAAC TATAATAAAA AAATCTGACT 1020 

CCCATATTTA CAAATAATTC TATTTATTTA TATATTATCT GAATTAATAC TCAATACAAA 1080 

25 CTAAAACGTA CTATTAAATT GTGCAAAGCT AAAACAAATT TATATTCATC TATCCAACAA 1140 

TATGTCTTAT CAATGGTATA GTCTTTGCAC ACCAATGGAG GAAATAAATC TCAACCTTAC 1200 

TATATTAATA TATAATCAAA TCTTAGATTA ACTAGTGTAA TGATACAGAT GATAATTGAG 1260 

TACAAATTTA AAACCCTGAG ATTTTCGCTT TAATTTGAAA ACCTCAGGGT TTATTTGATT 1320 

TTTATATAAT GAATCGTTAC ATTAAAAATA TTTATTTATC AGAGTTCTTA TATTTGTTAG 1380 

CGCCCCAAGC ACTAATTCCA AATAAGTTAA TTTCTAAGTT TTCAGGTTTA AAGACAGGGT 1440 

TCTTGCCTTC TTTTTTCTGC TTTTGATAAT CTTTCATCAA TGCAAAAGCT ACATTGGACA 1500 

GTCCTATAAT GGAAATAATG TTTACAATTG CCATTAAGCC CATAAATAAG TCTGCCGTAT 1560 

TCCATACTGT TTCTGTTTTT ACAACTGCAC CGACAAAGAC AAGTACTACA ACAAGACATC 1620 

TAAAGATAAA TAATATTACA CGGTTTGTTG ATAAAAATTC AATATTAGAT TGACCGTAAT 1680 

AGTAATTACC TACAACAGAT GAAAATGCAA ACAGTGTAAC tGCTaTTGTT AAGAAAATAC 1740 

45 CTCCAGCAGA ACCTAAATGC TCATTAAGTG CTGATTGAGT AACTGCAACA CCTTGAGGTG 1800 

CGTTATCACC AAATTTCAGT CCTGAATATA GTAAAATCAT GATTGGAGTT GCTGTACAAA 1860 

CCAACATTGT ATCAAAGAAC ACACCTAATG ATTGGATTAA ACCTTGCTTA ACAGGGTGTG 1920 

50 GTACGGCAGC AGTTGCCGCT GCATTCGGCG CAGAACCCAT ACCAGCTTCG TTAGAGAATA 1980 

AACCACGTTT GATACCTTGA AGAACCGCAG CACCTACAGC GCCACCAGTT ACTTGTTCGA 2040 
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GCAATATTAC TAAAACCATA CCAATGTAAA TGATAGCCAT AATCGGTACA ATTAACGAAG 2160 

ATAACGTAGC AATACTACGT ACACCACCAA ATATAATAAT AGCTGTTACG ATTGCTAAAA 2220 

TAATACCTGT GATTACTGGA CTAATATTAT ATTGCGTATT TAACGACTCC GCAATTGTAT 2280 

TAGATTGCAC TGTGTTAAAT ACAAATGCAA ATGTAATTGT AATTAAAATC GCAAATACGA 234 0 

TACCTAGCCA TTTTTGATTT AAACCTTTAG TAATATAGTA AGCTGGACCA CCACGGAATC 2400 

CACCATCTTT ATCATGTACT TTATAAACCT GAGCCAAAGT CGCTTCTATA AATGCACTCG 2460 

CTGCACCTAT AAATGCAATA ACCCACATCC AAAATACTGC ACCTGGACCG CCTAAAACAA 2520 

TCGCAGTCGC AACACCAGCA ATATTACCAG TACCAACTCT CGAACCAGCA CTAATCGCAA 2580 

ATGCTTGGAA TGGCGAAATA CCCTTCTTAC CATCTTCTAA AGTTTCTGGA CGTTCTACTA 2640 

AAGCTCTAAA CATTTCAGGT AACATTCGTA ATTGAACGAA TTTAGAACTA ATCGTAAAGA 2700 

AGAATCCAGC TGTCAATAAT AGACCAATTA AATATTGAGA CCATATTAAA TCGGTACCAA 2760 

CATGGACAAA TTCTTTAAAC CATCCAGGTA TTAAACTATC GAAATCTTTC AAAATAAACC 2820 

CCTCGCATCC TCTACATGAA TCATGTACCT TCTATAAAAT TAGACCGAAT TGAACCTTCA 2880 

2S GTAAATATAG AGATACATCA TCATTTCTTA TACAATACAA GAGATTTATA TTAGTTTGGT 294 0 

CAAAGTATAT CGCTAATTTA ACGATAAGTA CTTGGTCAGC ATTTAATATA AATCCCTTGA 3000 

ATTTAGTCAA AATTTAACAT TACTGTATTT TATCATTTAA TTTCGTGATT GCATATAGTT 3060 

30 TTTAGCTAAT ATACATGTCT ATTACTTCAC CAAAATCATC TGTATCTACA ATGAATGAGC 3120 

CATTTGTATA TTGTTCAGAT TTATGAATAT CATTAATTAA ACCATGTTCT TCATTTGATT 3180 

TTGAATATAA TGTATATTGA CTATGTTCAC CTGTCACTAC ATGTGCAGCT . ACAATACGAT 324 0 

GTGGATTTTT CTTTAATTCT TTTAATAAAG TTATTCCaCG TTGTGCTCTT TTAGCAACTT 3300 

GTAAGATTTT AAAACTAATA CGTTTTAACG AGCCGCGTTG TGTGGCCATC AATATAGTAT 3360 

CATTTTCAGA AACACCTTCT GTCATAACAA CGAAATCTTC AGCTTTAAGA TTTATTGATT 3420 

TAACACCAGC TGCCCTTAAT CCGGTATCTG ATAGTTCACT TGTATTATAC GTTAATGACA 3480 

TACCTTTATT AGTAATGACG GTAATTAATT GATCTTTTTC AAAGCGCATA ACACTAATCA 354 0 

AATCATCATT TTCTTTAACT TTAGTAGCAA TTAAAGGTTT ATTAAAACGC GTTGTTTTAA 3600 

ATAGAGGCAC TGTACTTTTC TTAATCATGC CATTTTGAGT CGCAAAAACA TAAAATGCAT 3660 

CTGTATTAAA GTCCTTTTCA TTAAAGACAT TAATAACCAC TTCATCTTCT TCGATAGGAA 3720 

so CTATTTGTGA TACATGTTGT CCCAATTCTT TCCAACGAAT ATCTGCTAAT TTATGAACCG 3780 
GTATAAATAG ATAACGACCT TTATTTGTAA ATACTAGTAC GGTATCTTGC GTATTTACTT ' 384 0 
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TAAAGCTACG AATAGAAGTA CGTTTAATAT ATCCATGACG TGTCATACTT AAAATAACTy 3 960 

CTTCACTAGG CACCATAACT TCTTTGTCAA TTTTAATTTC TTCAATTTCT GCTTCAATTA 4020 

5 AAGACAGTCG TTCAGATTTG AATTTCTTTT TAATTTjCATT CAATTCTTCT TTTATGACAT 4080 

TCAATAATGC ATCATGGTTA TCAAGAATAT GACGTAATTG TTTGATTAAT GCTTCAAGTT 414 0 

CTTTATGTTC ACCTTCAAGC GCAACTATGT CAGTATTTGT TAAACGATAT AACTGTAACA 4200 

10 

TTACAATTGC TTCAGCCTGT TCTTCTGTGA ACTCGTATAC TTCGATAAGG TTTTCTTTAG 4260 

CGTCACGCTT GTTTTTAGAG CwACGAATCA ATTCGATTAC TTTATCTAAA ATTGACAACG 4320 

CTTTAATCAA ACCTTCAACG ATATGCATAC G TT TTTCTGC ATTATCTAAT TCAAACTTCG 4 380 

15 

TTCTATTTGC AACAACCTCA ATTTGGTGAT TCAAATAACT ATCTATAATT TGACGAATAC 444 0 

CCATCAATTT TGGACGACCA TCACTAATAG CGACCATGTT GAAATTATAT GAAATCTGTA 4500 

2Q AATCAGAGTT TTTATAAAGA TAATTTCTGA TTGATTCACT GTTCACATCT TTTTTCAATT 4560 

CAATTGCTAT TCGTAAACCA GTTCTATCAG TTTCATCACG TACTTCAACG ATACCATCGA 4620 

CTTTTTTGTC AGCACGTAAT TCATCGATAC GTTTTACTAA GCTACTTTTG TTCACTTCAT 4680 

25 ATGGAATTTC AGTAATAATT AACTGTTTAC GTCCATTGCG TAAAGTTTCT TCTTCAACTT 4 74 0 

TAGAACGAAC TATAATTCTA CCTTTACCTG ATTCATAAGC TTTTTTAATA CCATCAATAC 4 800 

CTTGAATAAT ACCACCAGTT GGAAAATCAG GACCTTTAAT ATATTTCATT AATTGATTGA 4 860 

30 CTGTAATATC CGGATTATCA ATATATTTAA GTGTTGCTTG AATCACTTCA GCTAAATTAT 4 920 

GTGGTGGTAT ATCTGTCGCG TAACCTGCAG ATATACCTGT AGAACCATTC ACTAGTAAGT 4 980 

TAGGAAATCT TGATGGCAAT ACCATTGGTT CGAGTGTCGT ATCATCATAG TTTGGAATGA 504 0 

35 

AAGAAACTGT CTCTTTATTA ATATCACGTA ATAACTCTTC AGCTAGTAAG CTTAACTTAG 5100 

CTTCAGTGTA ACGCATTGCC GCTGGCGGAT CATTATCGAT ACTACCATTA TTACCATGCA 5160 

TTTCTATTAA GACATGTCGT AACTTCCAGT CTTGACTTAA ACGGACCATT GCTTCGTACA 5220 

40 

CTGAGGAGTC TCCATGTGGA TGATATTGAC CAATAACATC ACCGACTGTT TTCGCACTTT 528 0 

TACGGAAATT TTTATCGTGT GTATTACCAC TTGAATACAT TGCATATAAA ATACGACGTT 534 0 

45 GTACTGGTTT TAAACCATCA CGAACATCTG GCAATGCACG CTCTTGAATA ATATATTTAC 5400 

TATATCTTCC AAAGCGATCA CCTAAAACAT CTTCAAGTGA TAAATCTTGA ATTATTTCAC 54 60 

TCACTAGATT TCCTCCTCAT CAAATTGATC ATTTTCAAGC ACTTGTACTT CAGAATTATC 5520 

so TAAAATACTT TGGTCCTCTT GCATACCAAA CTCAACATGC TTTTCAATCC ATTCACGTCT 5580 

AGGTTGTACT TTGTCACCCA TTAATGTTGT TACACGTTTA GATGAACGCA CTTCATCTTC 564 0 

55 
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5 



70 



75 



20 



25 



30 



AGGGTTCATT 


TCACCCAAAC 


CTTTGTAACG 


TTGTAACGTG 


AaGCCTTTAC 


CAAGTTCTTT 


5760 


TTGCAATTTA 


TTAAGCTCTT 


CGTCTGTCCA 


AGCGTATTCA 


ACTCGCTTTG 


TTTTGCCTTT 


5820 


ACCTTTTTCC 


AATTTATAAA 


GTGGAGGTAA 


AGCAATAAAT 


ACACGACCTG 


CTTGAACAAG 


5880 


CGGTTTCATA 


TATTTGAAGA 


AGAATGTTAA 


CAATAGCACT 


TGAATATGCG 


CACCATCAGT 


5940 


ATCAGCATCA 


GTCATAATAA 


TTACACGATT 


ATAATTACTA 


TCTTCAATTT 


TAAAGTCAGT 


6000 


ACCAACGCCT 


GCCCCGATTG 


TGTGGATAAT 


TGTATTAATT 


TCTTCATTTT 


TAAAAATATC 


6060 


TTCTAGACGT 


GCTTTCTCTG 


TATTAATTAC 


CTTACCACGT 


AATGGTAATA 


TCGCTTGGAA 


6120 


TTTGCGGTCT 


CGTcCAAGTT 


TTGCTGAACC 


TCCCGCAGAA 


TCACCTTCGA CTAAATACAA 


6180 


TTCATTTTTT 


TCAGTGTTTT 


TACTTTGTGC 


AGGTGTTAAT 


TTACCAGATA 


GCAAAGTGTC 


6240 


TTTACGCTTG 


TTTTTCTTAC 


CTGAACGAGC 


ATCTTCACGA 


GCTTTACGTG 


CAGCTTCCCT 


6300 


TGCTTGTTGT 


GCTTTAATCG 


CTTTTTTCAC 


AAGTGATTTA 


GACAATTGTC 


CTTTTTCTTC 


6360 


TAAATAGAAT 


GGCAATTTGT 


CTGCAACAAC 


TGAATCAACA 


GCACTTCTAG 


CTTCAGAAGT 


6420 


ACCCAATTTA 


GATTTCGTTT 


GTCCTTCAAA 


TTGCAATAAT 


TCTTCTGGAA 


TACGAACAGA 


6480 


CACAACAGCT 


GTTAAACCTT 


CACGAATATC 


ATTACCATCT 


AAGTTTTTAT 


CTTTTGTTTT 


6540 


AAGTTCATTA 


ATACGACGTG 


CATAATCATT 


AAATACACGT 


GTCATTGCTG 


TTTTAAAACC 


6600 


AACTTCATGT 


GTACCACCAT 


CTTTAGTACG 


TACATTATTT 


ACAAAACTTA 


AAATACTTTC 


6660 


TGAATATTGA 


TCATTATATT 


GGAAAGCTAC 


GTCTACCTCT 


ATACCATTTG 


CTTCACCTGA 


6720 


AAATGTAGCC 


ACGTCATGCA 


AAACTTCTTT 


TCCTTCATTG 


ACATAACTAA 


CAAACTCTTT 


6780 


GATTCCTTCT 


TATAATGGTA 


TGTCTT 








6806 



(2) INFORMATION FOR SEQ ID NO: 473: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1716 base pairs 

(B) TYPE: nucleic acid 
40 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 473: 

45 

GGGGCAnAAA TTCCAATACA CTCATTACCA AATATATACA CCACTTCCTG CTACAAGTnn 60 

TTTTACTTGA TCTTGGTCTT TTCCGCAGAA AGAGCATTTC CAAATTTTCT TCATCTTCCA 120 

SO TTGAATTTAA ACATTCTTTT TACACCCCTA TTCGTTAAAG ACTATACTAG ATTGGATGTT 180 

ACAATGCAAC ATATTAACAT ACAAACTTTT TGCTTAAAGA ATAGTAGCAG ATACATAAGC 240 
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5 



10 



15 



20 



35 



40 



CCtTCAACGA 


ACTTTGCGTT 


ATCTCTTAAT 


AAATCGATAA 


CTTTTTGGAT 


ACGAACATCA 


360 


TTTTTAATGA 


TATCAGTATT 


ACCTAAAGTA 


TTTTTGATAT 


CTTCAACTGA 


GAT ATT AAAT 


420 


TGTTTACTCA 


TTTTTTCTAA 


TTCTTTATCG 


ATATCTTCAT 


CAGTAGCTTC 


GATTTTTTCA 


480 


GCTTCAGCGA 


TCGCAGTTAA 


AGTTAAGTTA 


GTTTTAACAC 


GTTGTTCTGC 


ATCGTCTTTC 


540 


ATTTGCTCTC 


TTAATTGAGT 


TTCATCTTGA 


CCTGAGATTT 


GGAAGTACGT 


TTGTAAATCT 


600 


AAACCTTGTT 


GTTGAATTCT 


TTGTGCAAAT 


TCAGACACCA 


TACGATCTAA 


TTCAGTATTA 


660 


ACCATTGCTT 


CAGGAATATC 


GATTGTTGTA 


TTATCAGTAG 


CTTTTGTAAT 


CGCTTCTTCT 


720 


TTTTCAACAT 


TTTCAGCATC 


TGTAGCTTTT 


TGTTCAGCTA 


AACGTTTAOG 


TAAGTTTTCT 


780 


TTGTACTCGT 


CTACTGTATT 


TGCTTCTGCA 


TCTAATTCAT 


TAGCAATTTC 


ATCTGTTAAT 


840 


TCTGGGACTT 


CTTTAAATTT 


AATTTCGTTA 


ACTTTTGTTT 


TGAAAGTTGC 


TTCTTTACCG 


900 


GCTAATTCTT 


CAGCATGGTA 


TTCTTCTGGG 


AATGTTACGA 


CAACATCTTT 


TTCTTCGTCA 


960 


ACTTTCATAC 


CTTCTAATTG 


CTCTTCGAAA 


CCAGGTATGA ATGAACCTGA ACCGATTTCT 


1020 


AAATCGTAAC 


CTTCAGCTTG 


TCCACCTTCG 


AATTCTTCtC 


CGTCAACTGA 


ACCACTAAAG 


1080 


TCGATGTTAA 


CTGTGTCGCC 


ATTTTCAACA 


ACACCATCTT 


CTTTAACGAC 


CATTTCAGCT 


1140 


AAATGTCCTA 


AGCTGTGGTC 


AATCGCTTCT 


TGTAACTCAT 


CATCAGATAA 


TTCAGTTTCT 


1200 


TGTTTTTCAA 


TTTCAAGACC 


TTTATAGTCT 


CCTAATTTAA 


CTTCTGGCTC 


AACTGTAACT 


1260 


GTTGCTTCAA 


AAATGAAATC 


TTTACCTTTT 


TCAATTTGAG 


TAACACTTAC 


TTCtGGTTGT 


1320 


GCAACTGGTT 


TAATATCAGT 


TTCGTCAATT 


GCTTCACCAT 


AAGCATCTGG 


TAATAAAATG 


1380 


TCGATAGCAT 


CTTGATATAA 


TGCTTCTACA 


CCAAAGCGTT 


GTTCAAAAAT 


TGGACGTGGC 


1440 


ACTTTACCTT 


TACGGAATCC 


AGGTACGTTA 


ATTTGTTTAA 


CCACTTTTTT 


GAATGCTTGA 


1500 


TCTAACGCTT 


TGTTTACTTT 


TTCTGCAGGA 


ACAGTAACAG 


TTAATAAACC 


TTCGTTACCT 


1560 


TCCTTTTTTT 


CCCAAGTTGC 


TGTCATGTAT 


ATATACCTCC 


ATGATTAACT AATTTATTTT 


1620 


TTCAACTTCC 


CTATTATATC 


ATACGTCTAT 


TCCCTATACA 


AACATTGAAA 


TCACAACGTT 


1680 


TATATATTTG 


TAAATCAACT 


TTTTTCGTCA 


AAACTA 






1716 


(2) INFORMATION FOR SEQ ID NO: 474: 









(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 795 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 
50 (D) TOPOLOGY: linear 
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TGACCAAGTA CGTTTCGAAG TTGCCATTAA AGCATTAAAC CCATCATTGA AAGCATTCGC 60 

. ACCTGTACGT GAGTGGGCAT GGAGTCGTGA AGAAGAAATC GATTATGCAA TTAAACATAA 120 

5 TATCCCTGTA TCAATCAACC ATGATTCACC TTATTCTATC GATCAAAATC TATGGGGCAG 180 

AGCGAATGAA TGTGGTATTT TAGAAGATCC TTATGCTGCG CCACCAGAGG ATGCGTTCGA 240 

TCTAACAAAT GCTTTAGAAG AAACACCAGA TACTGCTGAT GrAATCATTT TAACGTTTGA 300 

10 

TAAAGGCATC CCAGTTCAAA TTGATGGCAA AACATATGAA TTAGACGATT TAATTTTAAC 360 

GTTGAATGCA TTAGCTGGTA AGCATGGTAT CGGAAGAATT GACCATGTAG AAAATAGACT 420 

TGTAGGTATC AAATCAAGAG AAATTTATGA GGCACCTGCT GCAGAAGTTA TTTTAAAAGC 480 

15 

GCATAAAGCA TTAGAAACGA TTACGTTAAC GAAAGATGTC GCACACTTTA AACCAATCAT 54 0 

TGAGAAGCAA TTTGCTGAAC AACTATACAA TGGACTTTGG TTCTCACCTT TAACTGATAG 600 

CTTGAAATTA TTTATTGATA GTACTCAGCA ATACGTAAGT GGTGATGTCA GAATTAAATT 660 

20 

ATTCAAAGGT AATGCCATCG TGAATGGTAG AAAATCACCT TACACATTAT ATGATGAAAA 720 

ATTAGCAACT TATACAAAAG AAGATGCATT TnATCAAGAC . GCTGCTGTTG GCTTTATCGA 780 

2s TATCTATGGT TTACC 795 

(2) INFORMATION FOR SEQ ID NO: 475: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 887 base pairs 
30 (b) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 475: 

CGATTGAAAG AAGACGGTTC AGTTGAAAAG TTTCCAAAGC CAGTAATTAG CCAACAACCA 60 

GAAGGATATA CGAGTCATTT TAGAGATCCT AAAGTTTTTA AATATGATGr GaAATATTAT 120 

GCAATCaTTG GTGCmCaAAA TAATGATCaG CaAGGTCGAT TATTACTTTA TAATACTGAA 180 

GATATAATTA ATTGGCATTA TTTAGGTGAA ATAAATACAG AGTTGGATGA TTTTGGATAT 240 

ATGTGGGAAT GCCCAGATTA CTTTAATGTA GATAATCAAG ATGTCATACT TATTTGTCCA 300 

CAAGGTATTG AACCAAAAGG CGATCAGTTC AAAAATATTT ATCAAAGTGG TTATATACTT 360 

GGAAAGTTTG ATATTGAAAA GTTAACATAT GAACATGAAA ATTTTGTCGA GCTTGATAAT 420 

GGTTTTGATT TCTATGCACC TCAAACATTT TTAGATGAAA AAGGCCGACG AGTACTAATT 4 80 

GGATGGATGG GGTTACCGGA AATCGAATAT CCTACTGATA ATGAAGGATG GGCCCATTGC 540 
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GCGTTGGAAA AATTACGTCA CAATAAAGAG ACAGCATTtA GGctACGCAA ATAAATTTAC 660 

TCGAAAATTA CATCCGTATG AAGGTAAACA GTATGAATTA AT CAT AG AT A TTTTGGATAA 720 

TGATGCTACC GAAGTGTACT TTGAATTACG TACATCTAAG ACTTCTTCAA CATTAATTGC 780 

TTATAACAAG CGTGAAAATA AAATAACATT AGATCGCAGC GACAGTGGTT TATTGCCGAC 840 

AAATGTTGAA gGTACGACGC GTAGTACGAT ATTAGACACG CCATTAA 8B7 



(2) INFORMATION FOR SEQ ID NO: 476: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1183 base pairs 

(B) TYPE: nucleic acid 

15 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 476: 

20 





TTGGAAnCAA 


AAAACCATTG 


GTAAACCGTG 


TTnAACCGGA 


TTTCCGATGG 


ACCTTTTAAA 


60 




ACnACCAAAT 


AGAAAGCTTT 


GATAAAAGGT 


AATTATGGTA 


CTGATAACAA 


ACAAGTTCAA 


120 


25 


AAACATCATG 


ATTTAGTACG 


TATGCTTTTG 


ATGGATCAAG 


ATGGTTTTTT 


AACTGAAAAT 


180 




AATAAAGTTG 


ATCATTTCAT 


TGATGGAAAT 


GATTTATATG 


ATCAAGTTTT 


AAAAGATATT 


240 




AAAAATGCAA 


AAGAtATATC 


CATTTAGAGT 


ACwATACTTT 


CGCTTwAGAT 


GGTTwAGGTA 


300 


30 


AAAGAATTTT 


ACATGCTTTA 


GAAGAAAAAT 


TGAAACAAGG 


TCTAGAAGTA 


AAAATATTAT 


360 




ATGATGATGT 


TGGATCTAAA 


AATGTTAAGA 


TGGCAAATTT 


TGATCATTTT 


AAATCGTTAG 


420 




GTGGAGAAGT 


TGAAGCATTT 


TTTGCTTCAA 


AATTACCGTT 


ATTGAATTTC 


AGAATGAATA 


480 


35 


ATAGAAATCA 


TAGAAAAATC 


ATCGTAATCG 


ATGGTCAACT 


AGGTTATGTC 


GGAGGATTT A 


540 




ACATTGGTGA 


TGAATATCTm 


GGATTAGGAA 


AATTAGGATA 


TTGGAGAGAT 


ACGCATTTAC 


600 


40 


GTATACAAGG 


GGATGCGGTT 


GATGCACTGC 


AGTTGCGATT 


TATTTTAGAC 


TGGAATTCGC 


660 


AAGCGCACCG 


TCCACAATTT 


GAATATGATG 


TTAAGTATTT 


CCCTAAAAAG 


AACGGACCAT 


720 




TGGGCAATTC 


ACCAATTCAA 


ATAGCTGCAA 


GTGGCCCGGC 


TAGTGACTGG 


CATCAAATTG 


780 


45 


AATACGGTTA 


TACAAAAATG 


ATTATGAGTG 


CAAAGAAATC 


TGTATATTTA 


CAATCACCAT 


840 




ATTTCATTCC 


GGATAATTCA 


TATATaAATG 


CCATTAAAAT 


TGCTGCTAAA 


TCAGGTGTAG 


900 




ATGTACATTT 


AATGATTCCA 


TGTAAGCCAG 


ATCATCCATT 


AGTATATTGG 


GCGACATTTT 


960 


SO 


CAAATGCCTC 


TGACTTATTA 


TCAAGTGGTG 


TTAAAATTTA 


TACGTATGAA 


AATGGATTTA 


1020 




TACATTCTAA 


AATGTGCTTA 


ATTGATGATG 


AAATCGTATC 


AGTGGGCACA 


GCAAATATGG 


1080 
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CTAAAGATTT AAGGGTGGCT TATGAACATG ATATTACAAA ATC 
(2) INFORMATION FOR SEQ ID NO: 477: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2332 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



1183 



(Xi) SEQUENCE DESCRIPTION : SEQ ID NO: 477: 

GGTTATATGT TTGGTATTAC TCATTATATT GATTGGAGGT TGTGTCATTA TGACAAAAAC 60 

AAATGGTCGA AACGCTCAAA TTAAAGAAAA TTTCAACAAA ACATTAAGTG TATATCTAAC 120 

CAAGAATCTC GATGATTTTT ACGATAAGGA AGGTTTTCGA GATCAAGAAT TTGATAAAAG 180 

AGATAAAGGG ACTTGGATTA TTTATTCTGA AATGGTTATC GAACCAAAAG GGAAnAATAT 240 

GGAATCGAGA GGAATGGTGC TCTATATCAa TCGCAATACT AGAACmACGA AGGGTAATTT 300 

TATTGTCACC GAAATAACTG AAGATAGTAA AGGATATTCA CGTAGTAAAG AAAAAAAATA 360 

25 TCCTGTCAAG ATGGAAAATA ATCGAATTAT TCCAACAAAG CCTATACCGG ATGACAAGTT 4 20 

AAAAAAAGAG ATTGAAAACT TTAAGTTCTT TGTACAATAT GGAAATTTTA AAGATTTTAA 480 

AGATTATAAA AATGGTGATA TTTCATATAA TCCTAATGTG CCAAGTTATT CTGCAAAGTA 540 

30 TCAATTGAAT AATGATGACT ATAATGTTCA ACAGTTAAGA AAACGATATC ATATTCCAAC 600 

CAAACAAGCG CCCGAATTAA AATTGAAAGG ATCCGGCAAT TTAAAAGGCT CATCCGTAGG 660 

ATCTAAGGAT CTAGAATTTA CGTTTGTAGA AAATCAAGAA GAGAATATCT ATTTTTCAGA 720 

TTCGGTCGAA TTTACACCTA GCGAGGATGA TAAATCATGA GTCAAACGGA ATATCAAATA 780 

AAATCTGGCA ATATAAAAGG TAACTCTGAA GAAACAAGTA CAGTATCTAA TATAAGTTAT 840 

GAAATAGAAA ACGCAAATAA CAGTGGTTTA AAACAAAATA AAATTGATAA ACAAATTAAA 900 

AAGTTACAAG AAAAAAATAA ATTCCCTAAA AATCTTTCAT ATCTTAAAAG TTATACGGAC 960 

CCCAAAACAG GCACGACTAC AAGCGCCTTT TTAAATAAAG ACACTGGCAA AGTTACTTTA 1020 

GGTATGACAG GTACTAATGT ACACAAAGAC GCAATATTAA AACAAACATT TGGTGTTCCT 1080 

TCTTATCAAG GATATATAGA CGTGAGTGAA ACgCTaAAAG ATATTGGGGC CGATGT.CAAT 1140 

ATTGGCCTTC ATTCCGTCAC AGATAAAGAT CCACATTATA AAAATACCCA AGACTTTATC 1200 

SQ AAAAATATCA AAAAAGACTA TGATATTGAT ATTATTACCG GACATTCGCT GGGCGGTAGA 1260 

GATGCGATGA TTTTAGGTAT GAGTAATGAT ATTAAACATA TCGTTGTGTA TAATCCAGCT 1320 



55 



1401 



EP 0 786 519 A2 



1S 



20 



25 



ATTGAAAAGT 


ACGATGGTCA 


CATTGTAAGA 


TTTGTGTCTG 


ATGAAGACGA 


ATTAGATGCA 


1440 


GGTGTCCGCA 


ATCATTTATA 


TGAAACTGCT 


GGAGAAAAAA 


TAGTACTTAA 


AAATGGAGAA 


1500 


GGCCATGCAA 


TGAGTGGTAT 


TTTAATGAGC 


AGAACACAGG 


CTATAATCTT 


AGCTGAATTA 


1560 


AACAAAGTTA 


AAGGCTACCA 


AGACGAAAAT 


AATAAAGCAT 


TAAAATCCGT 


TCGTAAACAA 


1620 


ACGAGGCATA 


GATTACATAA 


AGTAGAGACG 


TTAAGAGCGA ATTGGATTCA 


AACAACGGGT 


1680 


GGATCACTCT 


CTTCCTCCCw 


ACAACAATTA 


TTAGAAGCTT 


TAACAGCACT 


AACCATTGCC 


1740 


GAAGGCTTAA 


ATCAATTAGT 


GAATGAAGAA 


AGCCAACATT 


TGAAAAAATG 


TATCACGCGA 


1800 


TGGCACATAA 


ATTTGGAGAC 


AACTGGAAAA 


AAGCGCAAGA AGTTGGAAAT 


GAAATTGGTG 


1860 


AAAAATTAAC 


CTCTGAAGAG 


GTTATAGATG 


rATTAAGAAA AGGTGGCGCG 


TATGAAAGTa 


1920 


AACTTGAAAC 


AGATCCCAAA 


AGAAAAATTG 


ATGATAAGAT 


AAAGAAATTA 


AATGATGTTT 


1980 


ATAAAAATTG 


TAATGGCTAT 


ATCGCAAAAA 


TTAAACAGAG 


TATCGAAGCA 


ATTGTTTCTA 


2040 


ATGACCAAAT 


GTTAGCGAGC 


CAGATTGATG 


GGATGATGTA 


ATGTTTACTA 


CGTATAAnAA 


2100 


TATTAATGAA 


CTTGAAAATG 


CCTATGATGA 


AGAAAGAAAA 


CAATTGAATG 


ATGCATTCAA 


2160 


TCAAATTGAT 


GAATTAAGAC 


ATCAAACACG 


CAAGAmATGT 


GAACAAATGT 


ATGATCATTT 


2220 


CTTATATCTC 


AAACATAAAA 


TGAATTmyms 


TGAAGACGCT 


ATGATCAGGA 


TGACACGTAT 


2280 


TATAGAATCT 


TTCGATAGAG 


AAACGAATCA 


ACGTATCCGA 


CATCACGAAA 


TG 


2332 



30 (2) INFORMATION FOR SEQ ID NO: 478: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 865 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
35 (D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 478: 

40 

TTTACTACCC AGTATCTCTT TTTATAAATT ATATAGCCAC CACATATGGT GGAAAGTCTT 60 
TTTAATTAGA ATTTTGTTTT TTCAGTTAAG AAAGCTTCTA ACTCTGAGAT TGGCATACGA 120 
ACTTGTTCCA TTGAATCTCT GTCACGTACT GTAACTTGAT TATCTTCTAA TGAATCAAAG 180 

45 

TCGAATGTtA CACAATAAGG TGTaCCGATT TCATCTTGAC GACGGTATCT TTTACCGATA 240 
GATTGTGATT CATCGAAATC GATTGAGAAT TTAGAACTTA ATTGCTCAAA AATCTTAATC 300 
so GtTCGCCAGA TAATTTCTTA CTTAAAGGTA AAATCGCTGC TTTATATGGT GCTAATGCAG 360 

GATGGAAGTG TAAAACTGTA CGTGCATCTT TACTACCTTC AACGCCTTCT TCATCATATG 420 
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GAATATATTT TTCGTTCGTT 


TCTGGATCAT 


GGTATCTGAA ATCTTCACCA GAGTGTTCAG 


54 0 




LAlbTTTACG TAAGTCGAAG 


TCTGTACGAC TTGCGATACC 




LLCLAALLAA 


600 


5 


ATGGGAATTT ATATTCAATA 


TCAGTTGTTG 


CATTTGAGTA 


ta *r*r* R TV *P TV 1\ T 


TCATCTTCAT 


660 




CATGATCACG TAAACGCATA 


TTTTCACTGC 


TCATATTTAA 


GCTTGTTAAC 


CAGTCACTTG 


720 




CAAAAGTTTT CCAATAATTT 


TGCCATTCGA 


TTTCTTCTCC 


AGGTTTACAG 


AAGAATTCAA 


780 


10 


GTTCCATTTG TTcAAATTCT 


CTTGTTCTGa 


AAATGaAGTT 


ACCTGGAGTG 


aTTTCaTTAC 


840 




GGaATGaTTT ACCAATTTGG ACCGG 








865 


15 
20 


(2) INFORMATION FOR SEQ ID NO: 479: 








(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1444 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 










(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 479: 






25 


TAATGAGTAA ATAAGTACCA 


GATAAAATCA 


TGAATATCAT 


CCAACATGCG 


GTTAACTCTA 


60 




CTAAATAATT AATAATAGTA 


TTTTCAGTAA 


ACAAAGAACT 


ATGTATACTT 


CGCATCACAT 


120 




TAGAATACGT ATGTTTCGCA 


TTTTGATCTG 


CAACAAATTG 


ATTGTTATGA 


r Pr w T 1 IV J\ TV JV> TV 

1 H AUAAAGA 


180 


30 


CGTAACGTTG ATTTCCTGCC 


ATATCACTCA 


GTGTAATTCG 


TTTGTTATAT 


Wj 1 I CATCAA 


240 




GTATGCTAAC TTTACTTACA 


AAGAATCCTT 


CATATTGTTG 


TTCAACTTGA 




300 




CATTTAATGT TTGATGCGTT 


TTTACATCAC 


TGTCACCAAA 


AAACTCATTC 


TTZvTTA 7A TATA T 


360 


35 


TATTTTCAAC TTCTGGAAAG 


AACAAGTAAC 


CAATGCCCGA 


AATGGTTAAA 




420 




GTGGAGCAAT AAATATTGCT 


GCATAGAAAT 


GTAATCTTTG 


TAATGGATTA 


/u\lwlAl 111 


480 


40 


TCATATTTCC CTCCCAATTG 


GCTATTATAC 


GGTGTCAATT 


CTGTGATGTG 


Tf?Tn A A HA 21 71 


54 0 


CTGTGACAAT ATTTATTTTC 


TAGAAAAATT 


TAACGATGAT 


TTGTGATTTT 


TAGAAAAATG 


600 




AACTTTTAAG TTGGAATGTT 


TGAAGAAAAT 


TGATTATTCG 


TATGTTTTAT 


CAAGCAGCTA 


660 


45 


TGATAAAATT TAAACATAAT 


ACAATGCGAG 


CCATTTAACG 


ATCTATGTTT 


AAATGGACAT 


720 




CGATATTGTA TGAATTCGTT 


GTAACAAGCA 


AGCATTTCTA 


TGTGAACGAA 


CCAAAGGGGA 


780 




AAGTAACATG ATTAATAAAG 


AACAATTAGA 


TCTTTTATAT 


AAATTAAAAA 


AAGAAGTTGA 


840 


50 


AAAGTCGCGA AATGAAGCAC 


TTTTACATAC 


AATTAACCAA 


GTAATTAAGA AAGTATATTT 


900 




GCAGCAATAT ACATGTTCGT 


TCGTTGGACA 


TTTTTCTGCA 


GGTAAATCGA 


CACTGATAAA 


960 



1403 



EP0 786 519 A2 

TATTGTGTCA GTTTCAGACA ATCACGATAT TATTGCTAAT TTGCCGAATC AAACGTATGC 1080 

CAAATTATCT AATTATGATG AAGTAAGGGA AATGAATCGC CAAAATGTCG ACGTTGAATC 1140 

5 TGTAGAAATT AATTTTCAAT CAGCTAAATT TGAAAATGGG TTTACGTTGC AAGATACACC 1200 

AGGTGTTGAT TCAAATGTTG CATCACATCA GTCAATAACA GAACAATATA TGTATACAAG 1260 

TAATATGATA TTTTATACGG TTGACTATAA CCACGTTCAA TCTGAACTTA ACTTTAAGTT 1320 

10 TATGAAGCAT ATAAATGATG TTGGaATACC TGTTGTGTTT ATCATTAATC AAATTGACAG 1380 

CATCCAAGAC GATGGAATTG TCATTCTCTA CGTnTTAAAT CTCGAGTTGG AAAAATCAAT 144 0 

TGGC 1444 



15 

(2) INFORMATION FOR SEQ ID NO: 4 80: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 6309 base pairs 

(B) TYPE: nucleic acid * 
20 < (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

2S . (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 480: 

GCAGCAGCTT ATCGTGAGTT ATCATTATTA TTACGTAGAC CTCCAGGTCG TGAAkCATAC 60 

CCAGGTGACG TATTCTACTT ACATAGTAGA tTATTAGAAA GAGCAGCAAA ATTAAACGAT 120 

30 GACTTAGGTG GCGGTTCAAT TACTGCATTA CCAATTATCG AAACACAAGC TGGTGATATT 180 

TCAGCTTATG TACCAACAAA CGTTATTTCA ATTACAGATG GACAAATCTT CTTACAATCT 24 0 

GATTTATTCT TCTCAGGTGT AAGACCAGCG ATTAATGCCG GACAATCTGT ATCTCGTGTT 300 

35 GG TGGATCTG CACAAATTAA AGCAATGAAG AAAGTTGCTG GTACGTTACG TCTTGACTTA 360 

GCGTCATACA GAGAACTTGA ATCATTTGCA CAATTCGGTT CAGACCTTGA TGAATTTACT 420 

GCAAGTAAAT TAGAACGTGG TAAACGTACT GTTGAAGTCT TAAAACAAGA TCAAAACAAA 480 

40 

CCATTACCAG TCGAACACCA AGTGTTGATT ATTTATGCAT TAACAAAAGG ATATTTAGAT 540 

GATATTCCAG TTGTAGATAT CACACGTTTT GAAGACGAGT TAAACCACTG GGCAGAATCA 600 

AATGCTACTG AACTGTTAAA TGAAATCAGA GAAACTGGTG GCTTACCAGA TGCTGAGAAG 660 

45 

TTTGACACAG CAATTAACGA ATTCAAAAAA AGCTTTAGCA AATCTGAATA ATAAACAAGT 720 

TTAGTATAAG GTGGTGAGAT AGTGGCTTCT CTTAAAGAAA TAGATACTCG AATAAAATCA 780 

50 ACCAAAAAAA TGAAGCAGAT TACGAAAGCG ATGAACATGG TATCAAGTTC AAAACTTCGT 84 0 

AGAGCTGAAA AAAATACAAA ACAATTCACA C CAT AT AT GG ATAAAATGCA AGATGCAATT 900 

55 
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ACTAGAAGTG GATATTTAGT TATCACGAGT GATAAAGGTT TAGCAGGTGC ATATAGTGCA 1020 

AACGTGCTTA AAAAATTGAT TACTGATATT GAAGCGAAAC ATCAAGATAG TAGCGAATAC 10B0 

AGTATTGTAG TTTTAGGGCA ACAAGGTGTT GATTTCCTAA AAAATAGAGG TTATGACATT 1140 

GAGTATTCTC AAGTAGACGT ACCTGATCAA CCTTCTTTCA AATCTGTTCA AGCACTAGCT 1200 

AACCATGCTA TAGACTTATA CAGTGAAGAA GAAATTGATG AATTAAATAT ATACTATAGT 1260 

CATTATGTCA GCGTTCTTGA AAACAAGCCT ACATCTAGAC AAGTATTACC ATTATCTCAA 1320 

GAGGATTCTA GTAAGGGGCA TGGTCATTTG TCTTCTTATG AATTTGAGCC AGATAAAGAA 13 80 

TCTATCTTAA GTGTAATCTT GCCTCAATAT GTTGAGAGTT TGATTTACGG AACAATATTA 1440 

GACGCAAAAG CAAGTGAGCA TGCAACACGT ATGACTGCGA TGAAAAATGC CACTGATAAT 1500 

GCAACTGAAC TTATTGATGA CTTATCATTA GAATATAACA GAGCGAGACA AGCAGAAATT 1560 

ACGCAACAAA TTACTGAAAT TGTTGGTGGT TCCGCAGCGC TTGAATAATA TTTAAAGGAG 1620 

GAAAATAGCA TGGGAATTGG CCGTGTAACT CAAGTTATGG GTCCTGTAAT TGATGTTCGA 1680 

TTTGAACATA ACGAAgTTCC TAAAATTAAT AACGCCTTGG TTATTGATGT GCCTAAAGAA 1740 

GAAGGTACAA TACAACTAAC ATTAGAAGTT GCGCTGCAAT TAGGTGACGA CGTTGTTCGT 1800 

ACAATTGCGA TGGATTCAAC TGATGGTGTC CAAAGAGGCA TGGATGTAAA AGATACAGGC 1860 

AAAGAAATTA GTGTACCTGT TGGTGACGAA ACATTAGGTC GTGTATTTAA TGTACTAGGT 1920 

30 GAAACAATTG ACCTTAAAGA AGAAATTAGT GATTCTGTTC GCCGCGATCC TATCCATCGT 1980 

CAAGCACCAG CATTCGATGA ACTTTCAACA GAAGTTCAAA TTTTAGAAAC AGGTATTAAA 2040 

GTAGTAGATT TACTAGCACC TTATATTAAA GGTGGTAAAA TCGGATTGTT CGGTGGTGCC 2100 

GGTGTAGGTA AAACAGTATT AATCCAAGAA TTAATTAACA ACATCGCTCA AGAGCACGGT 2160 

GGTATTTCTG TATTCGCCGG TGTAGGTGAA CGTACTCGTG AAGGTAACGA TTTATACTTC 2220 

GAAATGAGTG ACAGTGGTGT AATTAAGAAA ACAGCCATGG TATTCGGGCA AATGAATGAG 22 BO 

CCACCTGGTG CACGTATGCG TGTTGCATTA TCTGGTTTAA CAATGGCTGA ATATTTCCGT 234 0 

GACGAACAAG GTCAAGACGT ATTATTATTC ATCGATAACA TTTTCAGATT TACACAAGCT 2400 

GGTTCTGAGG TATCTGCATT ATTAGGTCGT ATGCCTTCTG CAGTAGGTTA CCAACCAACA 2460 

CTTGCTACTG AAATGGGACA ATTACAAGAA CGTATTACGT CTACAACAAA AGGATCAGTT 2520 

ACTTCTATTC AAGCGGTATT CGTACCTGCC GATGACTATA CTGACCCAGC GCCTGCGACA 2580 

So GCGTTTGCCC ATTTAGATGC AACTACAAAC TTAGAACGTA AATTAACTGA AATGGGTATT 264 0 

TATCCAGCCG TGGATCCATT AGCGTCTACA TCAAGAGCAT TGGAACCATC AATTGTAGGT 2700 



10 



15 



20 



25 



35 



40 



45 
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CAAGATATCA TTGCTATCTT AGGTATGGAC GAATTATCTG ATGAAGATAA ACAAACAGTT 2820 

GAACGCGCAC GTAGAATTCA ATTCTTCTTA TCTCAAAACT TCCACGTAGC GGAACAATTT 2880 

5 ACTGGTCAAA AAGGTTCTTA TGTACCTGTT AAGACAACAG TTGCAAACTT TAAAGATATC 2940 

TTAGATGGTA AATATGACCA TATTCCAGAA GATGCATTCC GTTTAGTTGG TAGCATGGAT 3000 

GATGTTATTG CAAAAGCTAA AGATATGGGT GTTGAAGTAT AACAATTAGG AGGAATGGAT 3060 

10 

AATGAATACA TTAAACCTAG ATATTGTCAC TCCTAATGGT TCTGTTTACA ATCGTGATAA 3120 

TGTTGAACTC GTTGTTATGC AAACAACAGC TGGTGAGATA GGTGTCATGA GTGGACATAT 3180 

TCCAACTGTA GCTGCTTTAA AAACAGGCTT TGTAAAAGTG AAATTTCACG ATGGAACTGA 3240 

15 

ATATATTGCT GTAAGCGATG GCTTTGTTGA AGTTAGAAAA GATAAAGTTT CAATCATTGT 3300 

TCAGACTGCA GAAACTGCAA GAGAAATTGA TGTTGAAAGA GCTAAATTAG CCAAAGCAAG 3360 

20 AGCAGAGTCT CACTTGGAAA ATGATGACGA CAATACTGAT ATTCATAGAG CCGAAAGAGC 3420 

TTTAGAGAGA GCAAATAACC GTTTGCGTGT GGCTGAATTA AAATAGTAAA TAAAGGGTCG 3480 

AAGATGTGAT TTCATATCTT CGACCCTTTT TTGAATTATA TTGATTTAAA GATACAAAAC 3540 

25 ATGAGAGGGG GGAAGGAATT GATAAAGAAC CATTAAAGAT TTATGATGTA GTGGTTCTTT 3600 

ATCATTAAAC ACAGCTAATG TGTATTTAAA AATAGGaayA CATgAGTAAA ACTCATGTAT 3660 

AAGAAATACT AATTTCTAAA GAAAAAGTAT TTCTTTATGT TGGGGCCCCG TCAACTACTG 3720 

30 CCAAATACAA CACTATAGAG TCTAGACATT GATTTATGTC CGACTCCCAA GAATAGTTTT 3780 

ACTTTTTTAC AATCACTAAT AGATTGCTAA AATCAAAATT TCCTTCACCA CTATCTACAG 3840 

TCGACATTTC ATTTTTTGAA ATTATCTACA TTTTTTCATA CCAAGATATT TTATAGTTAT 3900 

35 

GATATTTATG TAAAAAGAAT TATATAGTAA GTTAGCTTAA ACTTTACTAA AAACGGGTAT 3960 

TAAACTTTGT ATCATTATTT AAATTTTTCA TGTACAATGT AATACAGTAA TCTTATGAGG 4020 

TGATAAAATG GATTATATCG GACAATATGC AGTTATCCAT TTAGTGTTAC ATGTTGTATG 4080 

40 

TATTTGTATT GCCTATTGGG CTTTACAATC AATTAGATTA GATCAATTTT TTAAAAAAGG 4140 

ATACGCCACT CAATTACAAG TGTGTATGAT ATTTGTTGCT ATTTTATTAG GCACTGCAGT 4200 

45 AAGCAATTTT ATTGTAGATT TGTTACAATA CTCGACGCAG GTAAAATATT TAATAAAATA 4260 

AGTCTAACTC TATGATTTGT AATCAAAACT AGATATAATT AAATAATGAC TTAAAATAAT 4320 

TTTAAAATAG GGAAATGTAA AGTAATAGGA GTTCTAAGTG GAGGATTTAC GATGGATAAA 4380 

50 ATAGTAATCA AAGGTGGAAA TAAATTAACG GGTGAAGTTA AAGTAGAAGG TGCTAAAAAT 4440 

GCAGTATTAC GAATATTGAC AGCATCTTTA TTAGCTTCTG ATAAACCGAG CAAATTAGTT 4500 

55 
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GACGTTACAT ACAAAAAGGA CGAAAATGCT GTTGTCGTTG ATGCAACAAA GACTCTAAAT 4620 

GAAGAGGCAC CATATGAATA TGTTAGTAAA ATGCGTGCAA GTATTTTAGT TATGGGmCCT 4680 

5 CTTTTAGCAA GACTAGGACA TGCTATTGTT GCATTGCCTG GTGGTTGTGC AATTGGAAGT 4740 

AGACCGATTG AGCAACACAT TAAAGGTTTT GAAGCTTTAG GCGCAGAAAT TCATCTTGAA 4 800 

AATGGTAATA TTTATGCTAA TGCTAAAGAT GGATTAAAAG GTACATCAAT TCATTTAGAT 4860 

10 

TTTCCAAGTG TAGGAGCAAC ACAAAATATT ATTATGGCAG CATCATTAGC TAAGGGTAAG 4920 

ACTTTAATTG AAAATGCAGC TAAAGAACCT GAAATTGTCG ATTTAGCAAA CTACATTAAT 4980 

15 GAAATGGGTG GTAGAATTAC TGGTGCTGGT ACAGACACAA TTACAATCAA TGGTGTAGAA 5040 

TCATTACATG GTGTAGAACA TGCTATCATT CCAGATAGAA TTGAAGCAGG CACATTACTA 5100 

ATCGCTGGTG CTATAACGCG TGGTGATATT TTTGTACGTG GTGCAATCAA AGAACATATG 5160 

20 GCGAGTTTAG TCTATAAACT AGAAGAAATG GGCGTTGAAT TGGACTATCA AGAAGATGGT 5220 

ATTCGTGTAC GTGCTGAAGG GGAATTACAA CCTGTAGACA TCAAAACTCT ACGACATCCT 5280 

GGATTCCCGA CTGATATGCA ATCACAAATG ATGGCATTGT TATTAACGGC AAATGGTCAT 5340 

25 AAAGTCGTAA CCGAAACTGT TTTTGAAAAC CGTTTTATGC ATGTTGCAGA GTTCAAACGT 5400 

ATGAATGCTA ATATCAATGT AGAAGGTCGT aGTGCTAAAC TTGAAGGTAA AAGTCAATTG 54 60 

CAAGGTGCAC AAGTTAAAGC GACTGATTTA AGaGCAGCAG CCGCCTTAAT TTTAGCTGGA 5520 

30 

TTAGTTGCTG ATGGTAAnAC AAGCGTTACT GAATTAACGC ACCTAGATAG AGGCTATGTT 5580 

GACTTACACG GTAAATTGAA GCAATTAGGT GCAGACATTG AACGTATTAA CGATTAATTC 5640 

AGTAAATTAA TATAATGGAG GATTTCAACC ATGGAAACAA TTTTTGATTA TAACCAAATT 5700 

35 

AAACAAATTA TACCTCACAG ACAGCCATTT TTATTAATTG ATAAAGTAGT TGAATATGAA 5760 

GAAGGTCAAC GTTGTGTGGC T ATT AAACAA GTATCAGGAA ACGAACCATT CTTTCAAGGG 5820 

CATTTTCCTG AGTATGcGGT AATGCCAGGC GTATTAATTA CTGAAGCGTT AcTCAAACAG 5880 

40 

GTGCGGTAGC TATTTTAAAT AGTGAAGAAA ATAAAGGTAA AATCGCTTTA TTTGCTGGTA 5940 

TTGATAAATG TCGTTTTAAA CGTCAAGTAG TACCTGGTGA TACTTTAACG TTGGAAGTAG 6000 

45 AAATCACTAA AATTAAAGGA CCAATAGGTA AAGGTAATGC TAAAGCTACT GTCGATGGTC 6060 

AACTTGCTTG TAGTTGTGAA CTTACATTTG CAATTCAAGA TGTAAAATAA AACAAAAAAA 6120 

ACATTCAAAG ATTTAATGTG TTGGCATAAT CTTTGAATGT TTTTTATTTT ACTCTTCTAA 6180 

50 TTTTTCATCC TTTAACTTTG GTTTAGACTG CaTCATTCGA TTAAATGATT TTTTTAATTC 624 0 

TTCACCAGAT AATCCATCAT CAATAAGTTG GTTCTAATAA ACTTTCAGCA TACTGTTGGA 6300 

55 
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15 



20 



(2) INFORMATION FOR SEQ ID NO: 481: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH; 1717 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 481: 

AGTTGCTACA CCAGACATGA TGGGTGAAGT TGGTAAATTA GGTCGTGTAT TAGGACCAAA 60 

AGGTTTAATG CCAAACCCTA AAACTGGAAC TGTAACAATG GATGTTAAAA AAGCTGTTGA 120 

AGAAATCAAA GCTGGTAAAG TAGAATATCG TGCTGAAAAA GCTGGTATCG TACATGCATC 180 

AATTGGTAAA GTTTCATTTA CTGATGAACA ATTAATtGAA AACyTCaATA CyTTACAAGA 240 

v 

TGTATTAGCT AAAGCTAAAC CATCATCTGC TAAAGGTACA TACTTCAAAT CTGTTGCTGT 300 

AACTACAACA ATGGGTCCTG GAGTTAAAAT TGATACTGCA AGTTTCAAAT AATAAATGAT 360 

ATAAACAATT ACAGGCTGAA AGAAATATCT TTCAGTCTGT AAAAATATAT TGACAATAAG 420 

25 TAATTTCCAA GTTATATTAC TTATTGTGAT TATTTTACCT AAGACAGTAG GAGTTATTTA 4 80 

TAACTTAAAA TTTATCCTGC CGAGGCTAAA ATTGACTTGA ACGTGATGAT CTATGATCTT 540 

TCAAGCACTT TTTGCCGTGG GTAGAAAGTG C TTTT TTTAT TAATTTTAAA AAAAGCACCA 600 

AAAATTTAAA TGGAGGTGTC TGAATGTCTG CTATCATTGA AGCTAAAAAA CAACTAGTTG 660 

ATGAAATTGC TGAGGTACTA TCAAATTCAG TTTCAACAGT AATCGTTGAC TACCGTGGAT 720 

TAACAGTAGC TGAAGTTACT GACTTACGTT CACAATTACG TGAAGCTGGT GTTGAGTATA 780 

AAGTATACAA AAACACTATG GTACGTCGTG CAGCTGAAAA AGCTGGTATC GAAGGCTTAG 840 

ATGAATTCTT AACAGGTCCT ACTGCTATTG CAACTTCAAG TGAAGATGCT GTAGCTGCAG 900 

CGAAAGTAAT TTCTGGATTT GCTAAAGATC ATGAAGCATT AGAAATTAAA TCAGGCGTTA 960 

TGGAAGGCAA TGTTATTACA GCAGAAGAAG TTAAAACTGT TGGTTCATTA CCTTCACACG 1020 

ATGGTCTTGT ATCTATGCTT TTATCAGTAT TACAAGCTCC TGTACGCAAC TTCGCTTATG . 1080 

45 CGGTTAAAGC TATTGGAGAA CAAAAAGAAG AAAACGCTGA ATAATTTTTA GCGTAAAAAA 1140 

ATTAAAAATA ATGGAGGAAT TATAAAATGG CTAATCATGA ACAAATCATT GAAGCGATTA 1200 

AAGAAATGTC AGTATTAGAA TTAAACGACT TAGTAAAAGC AATTGAAGAA GAATTTGGTG 1260 

50 TAcTGcAGCT GCTCCAGTAG CAGTAGCAGG TGCAGCTGGT GGCGCTGACG CTGCAGCAGA 1320 

- AAAAACTGAA TTTGACGTTG AGTTAACTTC AGCTGGTTCA TCTAAAATCA AAGTTGTTAA 1380 
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TCCTAAAGTA ATCAAAGAAG CTTTACCTAA AGAAGAAGCT GAAAAACTTA AAGAACAATT 1500 

AGAAGAAGTT GGAGCTACTG TAGAATTAAA ATAATTCAAG TATCTTAAAC TTAATAATCA 1560 

AAGTTTTATA GCAAGTATTG CTATAATATA ATGATTCTTT GAGAAGTTAA AACCCCGTTA 1620 

TTTTGATAAC GGGgTtTTAT TCaTTTAAAG ACTGAGTGAA ATGTTATAAT TATAATGACG 1680 

. AGTTACAAAG TGAAGATGAG GTGGGAATAA TGAGTCA 1717 
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(2) INFORMATION FOR SEQ ID NO: 482: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1279 base pairs 

(B) TYPE: nucleic acid 

15 (C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

20 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 482: 

GTAAATCTGT TACTCGAAAT GTAACGATTA AAGAAAAGGG CTCATCTCAA ACATATATTT 60 

TGTTAGGCTA TCCAACAAAA GCACAGAAGA ATAGTCATAG CAAATATAGT GGAGTCTTTA 120 

25 TATATAAAGA CTTGAAATCA ATCGAAGATA CAAATAATGC TATTACGATT ATCACCATAA 180 

TTACGGCTGT TATTTTCTTA ACAATTACAA CAGTCTTTGC GTTTTTCTTA TCGTCAAGAA 240 

TTACAAAACC TTTAAGACGT TTAAGAGACC AAGCTACACG TGTATCTGAA GGGGATTACT 300 

CTTATAAACC TTCTGTCACA ACGAAAGATG AAATTGGTCA ATTATCGCAG GCATTTAATC 360 

AGATGAGTAC AGAAATCGAA GAGCATGTCG ACGCATTATC CACATCTAAA AATATTAGAG 420 

ACAGCTTAAT TAACTCTATG GTAGAAGGTG TCCTAGGTAT TAATGAGAGT CGACaAATTA 480 

35 

TCTTATCTAA TAAGATGGCG AATGATATTA TGGACAATAT TGATGAAGAT GCTAAAGCTT 540 

TCTTATTAAG ACAAATAGAA GATACTTTTA AATCAAAACA AACTGAAATG CGCGATTTAG 600 

AAaTGAATGC ACGATTCTTT GTTGTGACCA CAAGCTATAT CGACAAGATT GAACAGGGAG 660 

40 

GTAaAAGTGG TGTTGTTGTG ACAGTTCGTG ATATGACTAA TGAGCACAAT CTAGATCAAA 720 

TGAAGAAAGA TTTCATTGCT AATGTATCAC ATGAATTACG TACACCGATA TCATTACTTC 780 

45 AAGGTTATAC TGAATCAATT GTAGATGGTA TTGTTACAGA ACCGGATGAA ATAAAAGAAT ,840 

CGCTTGCCAT TGTCCTTGAT GAATCGAAAC GTTTAAATCG TTTAGTTAAT GAATTGTTAA 900 

Al'GTCGCACG CATGGATGCT GAAGGGTTAT CCGTAAATAA AGAAGTTCAG CCTATTGCAG 960 

so CGTTACTAGA TAAGATGAAA ATTAAGTATC GCCAACAAGC TGATGATTTA GGTCTAAATA 1020 
TGACTTTTAA TTAyTGTAAG AAGCGTGTTT GGAGTTATGA TAwGGATCGC ATGGACCAAG ■ 1080 

55 
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TTACTTGTGA TGAAAATGAA AGCGAAGATA TTTTATACAT TAAAGATACA GGTACAGGCA 1200 

TTGCACCAGA ACATTTACmA CAAGTATTTg ATCGTTTTTA TAAAGTTGAT GCAGCGnAnA 1260 

5 ACCCCGnGGT AACCAnGTA 1279 

(2) INFORMATION FOR SEQ ID NO: 483: 

(i) SEQUENCE CHARACTERISTICS: 
io t (A) LENGTH: 1144 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 483: 





GAGCTGTTGT 


TACTTTGATG 


CCTGCAGCTT 


TATTACGGCT 


GACTTGGTAA 


TGATAAGTTT 


60 


20 


CAGCATATTG 


CTCAATATAT 


GCTATATCAT 


ATTGAATGGT 


ACGAGGTGAT 


ACACCAAGTT 


120 




GATTAGCAAT 


GGTATTGATT 


GGAATAAACG 


TTTGCTCATG 


AATTAAAAGA 


TACAAAATTT 


180 




CGATTTGTCT 


ATAACTTAAC 


AACGTAATAT 


CCTCCTATTT 


GTAATTGTAA 


GCGATTTCTT 


240 


25 - 


AAAAACGTAG 


ATATGCAATC 


TCTTTCATAT 


TTTAATCCGA 


AAAATTGCAT 


ATCAAAATGT 


300 




TTATGGCGCA 


AGATTTTATA 


GGAACTTTTA 


AAATAAATTA 


rATATTCATG 


TTGACAATTT 


360 




AAAAATGTCG 


cAgtatattt AGTTAGACAT 


CTAACGAAAT 


GGTGGTGCAA 


TAAATGGAAT 


420 


30 


TCACTTATTC 


GTATTTATTT 


AGAATGATTA 


GTCATGAGAT 


GAAACAAAAG 


GCTGATCAAA 


480 




AGTTAGAGCA 


ATTTGATATT 


ACAAATGAGC 


AAGGTCATAC 


GTTAGGTTAT 


CTTTATGCAC 


540 


35 


ATCAACAAGA 


TGGACTGACA 


CAAAATGATa 


TTGcTAAAGC. 


ATTACAACGA 


ACAGGTCCAA 


600 


CTGTCAGTAA 


TTTATTAAGG 


AACCTTGAAC 


GTAAAAAGCT 


GATCTATCGC 


TATGTCGATG 


660 




CACAAGATAC 


GAGAAGAAAG 


AATATAGGGC 


TGACTACCTC 


TGGGATTAAA 


CTCGTAGAAG 


720 


40 


CATTCACTTC 


GATATTTGAT 


GAAATGGAAC 


AAACACTCGT 


ATCGCAGTTA 


TCTGAAGAAG 


780 




AAAATGAACA 


AATGAAAGCA AACTTAACTA 


AAATGTTATC 


TAGTTTACAA 


TAAATGATAA 


840 




GTGTGACTGG 


TAGAAATCAG 


TCACTTTGTC 


TTTAATATTA 


TAGTTAGATA 


TCTAATTGTT 


900 


45 


AGTAAGCTAA 


TTATTGGAAA 


AGACAAGGAG 


TATTGAACAA 


TGAAAGACGA 


ACAATTATAT 


960 




TATTTTGAGA 


AATCGCCAGT ATTTAAAGCG 


ATGATGCATT 


TCTCATTGCC 


AATGATGATA 


1020 




GGGACTTTAT 


TAAGCGTTAT TTATGGCATA TTAAATATTT ACTTTATAGG ATTtTyAGAm 


1080 


50 


GAyAGCCACA 


TGATTTCTGC 


tAatCTCTCT AACACTGCCA GTATTTGCTA TCTTAATGGG 


1140 




GTTA 












1144 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1158 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 484: 

10 





ACAACCAATT 


TTACTAAACA 


TGGTrrTCAT 


gCATTTTCAA TATTTAGATG 


TCGACCGCAT 


60 




AATCGAAGAA 


TCGCCGACAA 


TAGTACTTAT 


CGATGAGTTA 


GCACATACGA 


ATATTTCTAG 


120 


IS 


AGATCGTCAT 


GAGAAACGAT 


ATATGGATAT 


TGAAGAAATT 


TTAAATCATG 


GTATOGATGT 


180 




TCATACCACT 


TTGaACATTC 


aaCATATTGA 


AAGTTTAAGT 


AGTCAAATTG 


AACTGATGAC 


240 




CGGTGTACAT 


GTTAAAGAAC 


GTGTACCCGA 


CTATTTCATA ATGAGCGCCG ATGTATTAGA 


300 


20 


AGTCGTAGAT 


ATCTCACCTG 


AACAATTAAT 


TAAACGCTTA 


AAAGCTGGCA 


AGGTATATaA 


360 




AAAGGATAGG 


CTAGATGTAG 


CATTTAGTAA 


TTTCTTTACG 


TATGCCCACC 


TAAGCGAAtG 


420 




CGTACATTGA 


CGTTAAGAAC 


AGTTGCCGAC 


TTGATGAGTG 


ATAAAGAAAA 


AGTCCGACAC 


480 


25 


AACCATAAAA 


CGTCACTCAA 


ACCTCATATT 


GCTGTGGCAA 


TTAGTGGGAG 


CATTTATAAT 


540 




GAAGCAGTAA 


TTAAAGAGGC 


ATTCCATATT 


GCTCAAAAAG 


AACATGCGAa 


GTTCACTGCT 


600 




ATTTATATAG 


ATGTATTCGA 


AAAAAACAGG 


CAATATAAAG 


ATAGTCAAAA 


GCAAGTGCAT 


660 


30 


CAACATCTCA 


TGCTTGCAAA 


ATCATTAGGA 


GCAAAAGTAA 


AAGTAGTTTA 


TAGCCAAACC 


720 




GTTGCATTAG 


GATTAGACGA 


ATGGTGTAAA 


AATCAAGATG 


TAACCAAATT 


AATTATCGGA 


780 


35 


CAACATATTA 


GAAATAAGTG 


GCGAGACTTT 


TTCAATACAC 


CTTTAATTGA 


CCATTTAATG 


640 


TCCTTTGAAC 


ATAGCTATAA 


AATCGAAATC 


GTTCCAATCA 


AACAAATACC 


TGTTGAATTG 


900 




AAAATGAACA 


AATCACCCTA 


TCGTCCTAAA 


GGCAAACGTT 


TCGCCATAGA 


TATGTTAAAA 


960 


40 


ATGATTTTGA 


TTCAAATAAT 


TTGTGTAATG 


ATGGGACTGT 


GGATTTATCA 


ACTTGATAAG 


1020 




CATGAGTCTA 


GTACGATTAT 


TTTAATGATT 


TTTCTCATCG 


GCATCATTTT 


ATTATCCATT 


1080 




TGGACGCGGT 


CCTTCATCAT 


TGGCTTTTaG 


CAGCAATTAt 


TAACGTATTT 


GTgTkTAATT 


1140 


45 


ATkTTTTtAC 


GGAACCTA 










1158 




(2) INFORMATION FOR SEQ ID NO: 485: 









(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2224 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
<D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 485: 

ATCATATGGT CGATTTAACA GATCCAACGT ACTGCtAAAT AATTACATGA CGTTTAAACA 60 

TAGCATTGAT TATAACTATT TCTAAGTCTT CGCATTATTT GCGATGATGT GGGAATAGTT 120 

ATTTTTATTT AAAAATATAA AAAAATAGAT GCAGCAAAAT TTTAAAGCAT TTTATTTTGA 180 

ACATATTAAA AGGGAGCGTA TCATAATGGA ATGTAATGTT TATATCGTAT GCATTACGGA 240 

TAAATAATAT ATAAATCATT CTTGAGGAGT GAAAGAATAA TGAGAGACTA CACAAAGCAA 300 

TACATTAATG GCGAATGGGT AGAAAGTAAT AGTAATGAAA CGATAGAAGT TATAAATCCA 360 

GCAACCGAAG . AAGTAATCGG GAAAGTTGCT AAAGGTAATA AAGCTGATGT TGATAAAGCC 420 

GTCGAGGCGG CAGACGATGT TT ATTT AGAG TTCCGTCATA CATCTGTGAA AGAAAGACAA 480 

GCGTTATTAG ATAAAATTGT AAAAGAmTAT GAAAACAGAA AAGACGATAT TGTACAAGCT 540 

ATTACGGATG AATTAGGTGC TCCTTTATCA TTATCTGAGC GTGTCCATTA TCAAATGGGA 600 

CTAAACCATT TTGTTGCAGC GAGAGACGCA TTAGATAACT ACGAATTTGA AGAACGCCGC 660 

GGAGATGATT TAGTTGTTAA AGAAGCAATC GGTGTATCTG GATTAATTAC ACCGTGGAAC 720 

TTCCCTACAA ACCAAACATC ATTAAAATTA GCAGCAGCAT TTGCGGCTGG TAGTCCAGTT 780 

GTACTTAAAC CATCTGAAGA AACACCATTT GCAGCTGTTA TTTTAGCTGA GATTTTTGAT 840 

AAAGTCGGTG TTCCTAAAGG TGTATTTAAC CTTGTTAATG GTGATGGTGC TGGTGTTGGG 900 

30 AATCCTTTAT CTGAACATCC TAAAGTACGC ATGATGTCAT TTACAGGATC AGGCCCTACT 960 

GGTTCTAAAA TTATGGAAAA AGCCGCTAAA GATTTTAAAA AGGTATCATT AGAGCTTGGT 1020 

GGCAAATCAC CATATATCGT CCTAGATGAC GTAGATATTA AAGAAGCGGc TAAAGCAACa 1080 

35 aCAGGCAAAG TTGTTAATAA TACTGGTCAA GTATGTACAG CTGGTACACG TGTTTTAGTG 1140 

CCTAACAAAA TTAAAGATGC ATTCTTAGCT GAATTAAAAG AACAATTTAG CCAAGTGCGT 1200 

GTCGGTAATC CAAGAGAAGA TGGTACACAA GTAGGCCCTA TCATTAGTAA AAAACAATTT 1260 

GATCAAGTAC AAAATTATAT TAATAAAGGT ATTGAAGAAG GTGCTGAATT ATTTTATGGT 1320 

GGTCCTGGTA AACCAGAAGG ACTTGAAAAA GGATACTTTG CACGTCCGAC AATTTTTATT 1380 

AATGTAGATA ATCAAATGAC GATAGCACAA GAwGAAATTT TTGGGCCAGT AATGTCAGTT 1440 

ATCACTTATA ACGATTTAGA TGAAGCGATT CAAATTGCAA ATGATACAAA ATATGGTTTG 1500 

GCAGGATATG TTATTGGTAA GGACAAAGAA ACATTGCATA AAGTAGCTCG TTCTATTGAA 1560 

GCAGGTACAG TAGAAATAAA CGAAGCAGGT AGAAAGCCAG ATTTACCATT TGGTGGCTAT 1620 

AAACAATCTG GTTTAGGTCG TGAATGGGGC GATTATGGTA TTGAAGAGTT CTTAGAAGTG 1680 
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AGTGCACATG ACTAATTAAG TTTTGTGTAC TGTTTTAATT TTGCAATTTT TATAAATAGA 1800 

TTTTGTAATT AAAATAAAAA TTTGCTATAG TTATTCATGT ATTTAAAAGG TTGGGGATTA 1860 

5 GCATAATGGG ATTGTGCTAG CACAGTTATT TATGCATTGT CATGCCTATC TATTACTTAC 1920 

TAACTAAAAA ATAATGAAAT GGGTGTAAAC TATATGCCTG AAAGAGAACG TACATCTCCT 1980 

CAGTATGAAT CATTCCACGA ATTGTACAAG AACTATACTA CCAAGGAACT CACTCAnAAA 2040 

10 GCTAAAACTC TTAAGTTGAC GAACTATAGT AAATTAAATn AAAAAGAACT TGTTCTAGCT 2100 

ATTATGGAAG CACAAATGGA nAAAGATGGT AACTATTATA TGGAAGGTAT CTTAGATGAT 2160 

ATACAACCAG ATGGTTATGG TTTTTTAAGA ACAGTGAACT ATTCTAAAGG GGAAAAAGAT 2220 

15 

ATTT 2224 

(2) INFORMATION FOR SEQ ID NO: 4 86: 

(i) SEQUENCE CHARACTERISTICS: 
20 (A) LENGTH: 1690 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 



25 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 486: 





ACATTACnTT 


GAATCGAAAG 


TTTCATAAAC 


GACTTGAATG 


CCAGTTTCTT 


TTTCAAATTT 


60 


30 


CTTAATTAAC 


TCTGGATCAA 


TATATTCGCC 


CCAATTGTAT 


ACGTAAATTT 


TTTGATTTGT 


120 




ATGCACTTGT 


TCTTTAGATT 


TAAACCAATG 


ACTTAAAGTA 


AGACAAAGCA 


TACCCACAAC 


180 




TAATGCACCT 


ATAATGAGTT 


GTAAAAATCG 


TTTCATTATT 


TTACACCTCG 


CTTGATTAGT 


240 


35 


TTTTTCTTAT 


TTATCACGTA 


TTGAATCAAA 


TAATATCCTA 


GTATTCCTAA TACAATAACA 


300 




GCAAACAATA 


ATGTTGAAAT 


CGCATTAATT 


TCCATACTAA 


TTCCTTTTCT 


CGCCATAGCA 


360 




TAAACTTCAA 


CTGATAACAC 


ACTAAAGCCA 


TTACCAGTAA 


CGAAGAAACT 


TACTGTGAAA 


420 


40 


TCGTCTAGTG 


AATAAGTTAA 


AGCCATAAAG 


AATCCTCCTA 


TAATAGAAGG 


TAAAATATTA 


480 




GGAATAATAA 


TGTTGCTTAA 


TAATTGTGGT 


TCAGTCGCTC 


CTAAATCTCT 


TGCAGCATTT 


540 


45 


AACATATTAT 


TATTCATyTC 


ATACAGTTGT 


GGTAAGACGA 


TAATCACAAC 


TATAGGTATG 


600 


CAAAATGCAA 


TATGAGATAT 


TAGAACTGTC 


CaAAAkCCTA 


AACCAAGACC 


AGTAAAATGG 


660 




CCAATCGTTG 


TAAACATAAT 


TAAGAATGAT 


GCACCTATGA 


CAACGTCGGA 


TGATACCATC 


720 


SO 


AAGACATTAT 


TCAATGTTAG 


TAAAGTTACT 


TTAAACTTTT 


TATTTCTTAA 


ATAATAAATA 


780 


GCAATGGCAC 


CAAATGTACC 


AATAACTGTA 


GAAATTGAGG 


CTGCTAAAAG 


TGCTACAGCT 


840 
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AATGTAAAAT GTTCAAAGTG AATCATATTA CCAGCCGAAT TGAATGAATA GAACATTAAA 960 

AAGAATATTG GGATGTATAA AATCGCTAAA AGTATCCCGA TATACAGCTT TCCATACCAT 1020 

TTCATATGAT TCACCCTCTC CCATTAGATG ATTTTGTAAT GATTAAAATG AATGCCATAA 1080 

ATACAATTAA GAATATAGCT ATAGTTGATC CCATACCATA ATTTTGAATT GTTAAAAATT 1140 

GTTCCTCTAT TGCCGTACCT ATATTTATGA CTTTATTACC TGCAATTAAT CTTGTAATCA 1200 

TAAATAATGA AAGTGATGGA ATAAAGGTTA CTTGAATCCC AGTCATAACA CCTTCTTTTG 1260 

TTAACGGCAT GATTACTTTT CTAAAAGTAT AGAAAGGACT GGCACCTAAA TCACTTGAGG 1320 

CCTGCAATAA ATTATTAGGA ATTGCTTTCA TGCTATTAAA TATAGGTAAA ATCATAAATG 1380 

GTATATAAAT GTAACTTGCC ACTACTAAAA ACGCACCAGT TGTAAATAAC AAATTGAATG 1440 

ATGGTAAATT AAATAAGTGG AAAATTGATT AATCACGCCA TCATGACTTA ATAAACCTAT 1500 

AAAAG CAT AT GTCTTTAACA ATAAATTTAT CCATGTTGGA ATAATCATTA TCATTAATAA 1560 

GATATTTTGA AATTTCGAAC GAGTAATATA ATAGGCAGnT GGATAACTGA TAGTCAAGGT 1620 

AATAATTGTT ATTGAAGCGG CATATAAAAT TGAATATGCA AACATTTTCA AATATTTTGT 1680 
AGTAAAAATT 

(2) INFORMATION FOR SEQ ID NO: 487: 

<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2112 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



35 



40 



45 



50 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 487: 

ACGAAAAGAA ATATTATGAT GAACAAAAAG AAAGAATAAC GATTTATATG AAGTACAATG 60 

TGAAAGGTTA TAAAAATATA AGCTTCGCTA ATTTTAAAGA AAACCCAATG GATGGTTATT 120 

CTATTAGTGG TTATATAAAT AAtGaTAAAA AGTTATCATT TACAGCTGGT ATAAGATCTG 180 

TTGATGATTT TCAATTTGAT ACCGATATTT CTTATACAGA TGAATTGGGT AGAAAATTTA 240 

ATAAAAATCC TAAGTCAGTT TCTGAAATAA AAAAAGAGCA AAATACGTCC AATAAATAAT 300 

TGTTCATATT GTGATGAAAC AAAAATATAA GTCATTAGAT GAGTTTAACT ATGTTATAAA 360 

TATTTGTAGT ATCTATAAAA ATCTCGACAC TATTAAAATG ATAAAGTGCC GAGGTTTTCT 420 

TACTTATTTA GTTAATTCAA AGTTTATGCC AGATTCATAA GAATTTGTGA CACTTTTAAT 480 

AGTGTAcCAT TGATTATTAC AATTTATCAA ATGGTCCTTT AGAAGGTATA AATAACAAAA 540 
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TATTATTATG 


TTCAAAACTT 


TACGCTCCAA 


AAAGTAAAAA 


GGAAGTTAAG 


CAATGTTTAG 


660 


TTGCTTAaCT 


TCGGaTATTG 


AACGCATCAG 


TCCAATTTGA 


CATAGAGCCT 


TTTTTAGTTC 


720 


TTGATGTTTC 


TCTTTAAAAC 


CTTGCATATT 


TTACAAAAAG 


AAAAATTAGC 


AGTATAATTA 


780 


AGACAACGAA 


AATAAGTATT 


TACTTATACA 


CCAATCCCCT 


CACTATTTGC 


GGTAGTGAGG 


640 


GGATTTTTAT 


TGGTGCGGCT 


ATATGTCACC 


TATTTTGTAT 


TGCGTCTACT 


TAGCCAATAA 


900 


GAAAAAAACG 


CAATGGCACA 


GCCACTGATG 


ACTGGTGCTA TGATGTGAAC 


GaAAATAAGC 


960 


ATCACCTTAT 


ACACCTCCTC 


TCTGCGTCTA 


AATTGACGsC 


TGAGaGrTAG 


GcGACTCTAC 


1020 


TATTATATCA 


TCGGCAAATA 


TACAAGCACA 


GTCACTTGCT 


TCTGATAAGT 


TATATGATTC 


1080 


TAGCTGATAG 


ATTGAATCGT 


CTACACTTAA 


TTGGACAAAT 


TCTATGAGAA 


TAGATATTGT 


1140 


TAATTTAAGA 


AAGTAGGCGA 


TTTTATTATG 


ACAAGAGAAA 


GAAGATCATT 


TAGTTCAGAG 


1200 


TTTAAGTTAC 


AAATGGTTAG 


ATTATATAAA 


AATGGTAAGC 


CTAGGAATGA 


AATTATACGC 


1260 


GAGTATGATT 


TCACACCTTC 


GACGTTTGTA 


AATGGCGGTT 


ATAAAATGTA 


GGAAAATGGA 


1320 


TAAAGCAACA 


TCAAAACACG 


GGTACATTCA 


ATCACCAAGA 


TAACTTATCG 


GATGAAGAAA 


1380 


AAGAGCTGAT 


TAAATTACGC 


AAAGAAGTTC 


AACATTTAAA 


AATGGAGAAC 


GATATTTTAA 


1440 


AGCAAGTAGC 


GCTGATTATG 


GGGCAAAAAT 


AGAAGTCATT 


CAAAAGAATG 


CACATCAATA 


• 1500 


TTCAGTATCA 


GCAATGTGTA 


AAGTCCTGAT 


AATACTAAGA 


AGTACCTATT 


ATGATTCTAT 


1560 


AAAAAGAAAA 


GATAATAAAA 


TCACTAAAGA 


TGATTCAAAC 


ATAGAACATG 


CCGTCATAAA 


1620 


TATTTTTAAT 


TCTAATAGAA 


AAGTCTTTGG 


TACAAGACGA 


ATTAAAAATC 


ATTTAAATGA 


1680 


CAAGGGTCTC 


ACTGTATCTG 


GACAAAAGAT 


AGGTCGATCA 


TGAAAAAATC 


TAGTTTCTGT 


1740 


TTATACGAAA 


TCTAAATACA 


AAAATCATCT 


AAAAGAAACT 


AATGAAAAAC 


GAATTAAAAA 


1800 


TCTTTATTAT 


TAGCTGCTGG 


TGTATTATTT 


GTTAGTCCAA 


TTTCATTATC 


TTATAATTCA 


1860 


GATGTAGCTC 


ATGCTGAAGA 


TAAGTTAGAC 


CATTCTCAAG 


CAAAGGTAAT ATATTTGAGT 


1920 


AACCAAAATT 


TATTTGATGA 


ACTTGAGAAA 


AAAQGTTATA AACTGGAAGA TATATTTACA 


1980 


AAAGAAGAAA 


TAAAAAAATA 


TAAAGCTGAA 


GACCAATTGA GAGCGGGTAA AACTCAATAT 


2040 


GTAGAAACAG 


GTAAAGATAC 


TGCAACATTA 


TATCTTTCTT 


CTGCATATAC AAAAACAATA 


2100 



45 

GCTGCTTTAG GT 

(2) INFORMATION FOR SEQ ID NO: 488: 

(i) SEQUENCE CHARACTERISTICS: 
50 <A) LENGTH: 454 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

55 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 488: 

s GTAGGCACAC ATCTGCCATA TAAACATTCT TTTATACTAG TGTTCTCATA TAGTGTAGAG 60 

TTATAGTCTC CTTCTTGAAT CTCGAATAAT TCAATCAACC TATCAACCTT AGTCTCTTCC 120 

GTTACTTCTT TTTCAATATC AACTATGAAG GGGATATCAA TTGGAATAAA ACTTGACGTC 180 

10 GAACACTTAT TTGTATTTGG ATGAAAACGA ACGAATCCAT CACTAAATCC TGTTGAAAAA 24 0 

AATATTTTTC CTTGTGATAG ATCCGGATTT TCTCGCGCCC ATTTAATTAA TTCATCTAAT 300 

CTCATTTCTT TTTTAACTTT GATTTTCATT GTTATATCTC CTCTTGAACA GTAAATTTAT 360 

15 CGTTAAtTGA TACGTATCCA GTCACATTAC ATAAGATGCT ATCAACATCA AAAGTCACAC 420 

AACAGTTGCG TTCAACATCA TTTGAATAGA ATCT 454 



(2) INFORMATION FOR SEQ ID NO: 489: 

20 (ij SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1372 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

25 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 489: 
TTGTCAGAAT TAGAATGCTT TTGAGTTACT TCATAATACT CATCAGTTTT TTGTGTATCC 60 

30 

TTTTGACTTT TATTTATTTC TTTCCACTTA CCAGTATGAC TTTCTTTTTT TACAGTTATT 120 
TTCGGTTTGT TTAAAAAATG ATAACCGATG TTCTTTTTGG TATCTGTGGA CTCTAAAAAG 180 
ACTGAATTGT TTTCCTGATT ATCAGAATTG GTTGTTTGTT TATCGTCTGT ATATAACGTA 24 0 

35 

TACCCATTCG CTTTGCGATT TTCAATCGTT GTAACTGGAT TCTTTGATGA ATCAGTACTT 300 
TTAATGCCAG TTCCTAAGAA GACAATTTTA TCGTTTAATA TGAAATATGA TTTTTTGGCA 360 
GTTAAAGTTT TGTCCTGATT TTCAAAATCC ATTCCGATAC TAGCATGTTG GTCATCAACT 420 

40 

TTTGTTCCGC CAACAAAAGT TTTACTCGAC TTTTTATCAT CCGTATCTTT TAATATTTCA 480 
TTGTCTAAAG TTGTTGTACC TGATAAACGT TTCATATCGG CTGTCACCCA GAAGTTATCA 54 0 

45 TGATAGTGTT TGACATCGCT GTTATATAAA TAAGACATTC CAGCACCAGT GTGCCAACCT 600 

TTTAAATTCT CTCCGTTGAT ACTTTCATAG CGTGCTACGT TTTTCGACGT CATACTTAAA 660 
CCAAATGCAA AGTCTAAGTC TTTGTTATGA TAGGTGACAC GATCCATGTC ATTATATATT 720 

50 TTAAGTTGTT GTGTTAATCC GTTTTTAGAA ATACTGTTAT CTGTCATTAA AGACTTCATT 780 
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ACTGAAGATT TGACAATCTT 


TTTATACTTA GCTTTTGTTG 


AATCATCCAT 


GGCATCACTT 


900 




AATCTCAACA ATGATTTCAT 


TACTGTTGCA GATGCTGAGT 


GACTGGTTTC 


ATTTTCACGA 


960 


5 


CTGATAGCTC TACCTCGTGA 


TAAATCCATC ATTTCACCTT 


TATAAATGAG 


TGGCATAAAT 


1020 




CCGTCGTCAA TCCATGACTT 


TAAGGTTGTA TCATTTTGGG 


TTTTATCATT 


AAAAGGTGTT 


1080 




TCTTTTATCA TCGGCATCAT 


TTGAGAAATC CCCTCTAAGA 


GTACAACGCC 


ATAAGCACCA 


1140 


10 


GTGTATGGAA CGTCTTGATG 


ATCAATGTAA GAGCCATCTT 


TATAAAATCC 


ATTACGTTCT 


1200 




TTACGAGTGG CAGAATCTTG AACGTAAGTG AAGACTTTAT TAAATGAATC TATAGACTTT 


1260 


15 


TTCATCATAT CTTTATCTTC 


TTCGATAATA CATTCTAAAA 


GTTTCACCTT 


AGAAATGTCT 


1320 


ACTAnATTTC CGCCTTTAGC 


AAGTTCAGnT TTTCCTACAC 


AAGATAATAT 


TT 


1372 




(2) INFORMATION FOR SEQ ID NO: 490: 








20 


(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 564 base pairs 
(B> TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 








25 


(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 4 90: 








ACAACAATAT AGTAAAGCGT 


CGTTAATTAA AGAATGGGAC 


CAATTTGTTC 


GTCTTATATA 


60 


30 


AATGTACTTT aCCTTTATTT 


TTACAAAAAT AGCATTTTCC 


TATGTCATTT 


AACTAAACAT 


120 




GTAAGTTCGT ATGAACGAGG 


TTTGTTAAAT AGATGATTCT 


AGGAAAATGC 




180 




TGACTTAGTT TAAAATATTT 


TGCCACTTTG TACTGATAGT 


AGTTGCATTG 


TACTGTTGTG 


240 


35 


CAGATTCTAT GCTATTAATT 


GAAAACTGTT GCAATTTTTG 


AGTATTATTT 


AGTAATTGGT 


300. 




CGACCTTTTC AACCATTTGA 


TTGATGTCAC CTTGAGGTAC 


TAAATAGCCA 


TTAAATCCAT 


360 




CTTGaATCAG TTCTGaTGGA 


CCATAATCTA CATCATAACT 


GATCACTGGT 


GTACCTACTG 


420 


40 


AAAgCGACTC TAAAATTGCT 


AAGCCAAAAC CTTCCATTTT 


ACTTGTCGAT AACATCAGTT 


480 




CTGCTTTAGC AATCTCTTCA 


TTAATATGCG TCTTAAAACC 


ATGAAATTTA ACATGTTCCA 


54 0 


45 


GATATnATGA TAATCTTCTA 


CAAG 






564 



<2) INFORMATION FOR SEQ ID NO: 491: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1277 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 
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<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 491: 

TATCCACCCC ACGAnAGCCC CGGAAACTTA TTGTGTTACA AGATATATAA GCAGAAACGA 60 

ACAACAGTTA ACAAAATAAA TGAAATTAAA CGTTTTAAAA ATGAAACAAA TGAAATCATC 120 

TATTAGGTTA TGAAACTGTT TATAGCTTGA ATAGAAGCAT TTATTTTTTA GGAGGACAAT 180 

TATTATGCGT CAAACATTTA TGGCAAATGA ATCAAACATT GAGCGCAAAT GGTATGTTAT 240 

CGATGCTGAA GGCCAAACAT TAGGTCGTTT ATCATCAGAA GTAGCATCTA TCTTACGCGG 300 

TAAAAATAAA GTAACTTACA CACCACACGT TGATACTGGT GATTATGTAA TCGTTATTAA 360 

TGCATCAAAA ATCGAATTTA CTGGTAACAA AGAAACTGAC AAAGTTTACT ACCGTCACTC 420 

AAATCACCCA GGTGGTATCA AATCAATCAC TGCTGGTGAA TTAAGAAGAA CTAACCCAGA 480 

ACGTTTAATT GAAAACTCAA TTAAAGGTAT GTTACCAAGC ACTCGTTTAG GCGAAAAACA . 540 

AGGTAAAAAA TTATTTGTAT ATGGTGGCGC TGAACATCCA CACGCTGCAC AACAACCAGA 600 

AAACTACGAA TTACGTGGTT AATTAGAAGG AGGAAATGAC TTTGGCACAA GTTGAATATA 660 

GAGGCACAGG CCGTCGTAAA AACTCwGtAG CACGTGTACG TTTaGTACCa GGTGAAGGTA 720 

ACATCACAGT TAATAACCGT GACGTACGCG AATACTTACC ATTCGAATCA TTAATTTTAG 780 

ACTTAAACCA ACCATTTGAT GTAACTGAAa CTAAAGGTAa CTATGATGTT TTAGTTAACG 640 

TTCATGGTGG TGnTTCACTG GACAAGCTCA AGCTATCCGT CACGGAATCG CTCGTGCATT 900 

30 ATTAGAAGCA GATCCTGAAT ACAGAGGTTC TTTAAAACGC GCTGGATTAC TTACTCGTGA 960 

CCCACGTATG AAAGAACATA AAAAACCAGG TCTTAAAGCA GCTCGTCGTT CACCTCAATT 1020 

CTCAAAACGT TAATTGTCGG ACGATATATA CAAAACACCT CGATATTATG TCGAGGTGTT 1080 

35 TTTTTGGCGT TTTTG CGGCG AATATGGAAT GTGTAGAATA TAAATGAATT TTTACCTTCC 1140 

CACCATAAAA GATGAAGAAC CATGAATGTG GAGAACAATA AATAGTTGGA TATTCTGTTA 1200 

TTTTTTTGGA AGTGGAAGTG GATTTGGAAT ACTTTACTCn AAACGATTAA AAGGTTTAAA 1260 

40 AAAACAACAA AnAGAAA 1277 

(2) INFORMATION FOR SEQ ID NO: 492: 

(i) SEQUENCE CHARACTERISTICS: 
45 (A) LENGTH: 673 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



10 



15 



20 



25 



50 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 492: 



1418 



EP 0 786 519 A2 



TTATTGACAT TGTTTTTATC CAAAATTCAT TGTTAAGACA TTTTCTTTAT GAAATAATAA 120 

TnATATTGAA GTATATTTTT ATTATTATTA AAAATAAATA AGGGGATACT TATGAGCACA 180 

5 AATCAAACAT TTTTAATATT TGTTATAGCA ATTATTCTAC TTACATCTGT AATAGGAATT . 240 

GTTGGACGAT ACATGAGTCG TCAACGTCTA TTAAAATCTA TGGAAACATT ATGGCAAACG 300 

ATTTCTCCAT TAGAAGCTTT TATCAGACCG AACTCACATT TCGACTATGA GTATAAGCTC 360 

10 

TACAAGGAAA AATTTGAATC ACATTCATTA GTTGATGATA AAACTTGGTC CGACTTAAAT 420 

ATGAATGCAA TCTTTCATAA GATGAATTAT AATTTAACAG CTATTGGTGA AATGAAGCTA 480 

TATGCCTGTT TACGTGGAAT GCTTTCAATT ACGAACAAAT CATTACTTAG TTTATTTAAT 540 

15 

GATAATGCTG AATTTAGAAA AAACGTAACA TATCATTTAG CTTTGATTGG tAAAACTGTT €00 
aTCCAACATT TCCAGACCAA ATCACACCGG kAAACGTCCA AATATATTGn TCTATGCCCG 660 
GTTTACCAGT ATC 673 

20 

(2) INFORMATION FOR SEQ ID NO: 493: 

<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1240 base pairs 
25 (B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



30 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 493: 



35 



40 



SO 



AAAAAAAGTT 


AATGCTGACG 


GTGTATTAAC 


TTTTGATATT 


CTAGAAAATA 


AATATACTTA 


60 


TGAAGTTATT 


AACGCTATAG 


GGAAAAGATG 


GATTGTTAGT 


CATGTCGAAG 


GTGAAAACGA 


120 


CAAGAAAGAA 


TATGTAATAA 


CTGTCATTGA 


TAGGAAATCA 


GAAGGCGACA 


GACAACTGGT 


180 


TGAATGTACT 


GCTAGAGAGA 


TTCCCATAGA 


CAAGTTAATG 


ATTGATAGAA 


TTTATGTTAA 


240 


TGTAACAGGA 


TCTTTTACAG 


TAGAAAGATA 


TTTTAACATT 


GTGTTTCAAG 


GTACTGGAAT 


300 


GCTTTTTGAA 


GTCGAGGGCA 


AAGTTAAATC 


TTCAAAGTTT 


GAAAATGGTG 


GTGAAGGCGA 


360 


TACAAGGTTA 


GAAATGTTTA 


AAAAGGGATT 


AGAACATTTC 


GGTTTAGAAT 


ATAAAATAAC 


420 


GTATGACAAA 


AAGAAAGACA 


GATATAAGTT 


TGTATTGACG 


CCTTTTGCAA 


ATCAAAAAGC 


480 


GTCTTATTTT 


ATTTCTGACG 


AAtCAACGCC 


AACGCTATAA 


AACTCGAGGA AGATGCAAGT 


540 


GATTTCGCCA 


CCTTCATTAG 


AGGATATGGT 


AATTATTCAG 


GAGAaGAAAC 


ATTCGAACAC 


600 


GCTGGGCTCG 


TAATGGAACiC 


TAGAAGTGCA 


TTAGCTGAAA 


TATACGGCGA 


CATCCACGCA 


660 


GAACCATTTA 


AAGATGGTAA 


AGTGACTGAC 


CAAGAAACTA 


TGGATAAAGA ATTACAATCG 


720 
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TATCCAGAAG CAGACCCACA ACCCGGAGAC ATAGTACAAA TAAAATCTAC CAAACTAGGT 840 

TTGAATGATT TAGTCCGTAT AGTACAAGTT AAAACGATTA GGGGTATAAA CAATGTAATT 900 

GTTAAGCAAG ATGTAACGCT TGGTGAGTTT AATCGAGAAC AACGATATAT GAAAAAAGTT 960 

AATACTGCAG CTAACTATGT TTCTGGATTA AATGATGTTA ACCTTTCTAA TCCTAGTAAA 1020 

GCGGCAGAAA ACTTGAAGTC TAAAGTAGCG TCAATAGCTA AATCAACACT CGATTTGATG 1080 

AGTAGAACTG ATTTGATTGA AGATAAACAA CAGAAGGTAA GCTCTAAAAC TGTGACTACA 1140 

TCTGACGGCA CTATCGTTCA TGATTTTATa GATaAATCmA ACATTAAaGA TGTAAAAmCG 1200 

aTTGGAACGa TTGGCGATtC TGTAGCTAGA GGATCACATG 1240 



15 

(2) INFORMATION FOR SEQ ID NO: 494: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1311 base pairs 

(B) TYPE: nucleic acid 
20 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 494: 



30 



45 



50 



ACGGTGGATT 


TAGCCTAGAA 


GATTTAACGC 


ATCAAGGTAa 


ATTaTCAGCA 


TTTAGCTTTA 


60 


ATGATCAAaC 


AGGTCAAGCA 


ACATTGATTA 


CTAATGAAGA 


TGAAAACTTC 


GTAAAAGATG 


120 


AGCAACGTGC 


TGGCGTAGAT 


GCAAATTATT 


ACGCTAAACA 


AACATATGAT 


TATTACAAAG 


180 


ACACATTTGG 


TCGTGAATCA 


TATGaCAACC 


AAGGTAGTCC 


AATTGTTTCA 


TTAACGCATG 


240 


TTAATAACTA 


CGGTGGTCAA 


GATAACAGAA 


ATAATGCCGC 


ATGGATCGGT 


GACAAAATGA 


300 


TCTATGGTGA 


TGGTGATGGT 


CGCACATTCA 


CAAGTTTATC 


GGGTGCAAAT 


GACGTAGTAG 


360 


CACACGAATT 


aACACACGGT 


GTGACACAAG 


AGACAGCGAA 


CTTAGAATAT 


AAGGACCAGT 


420 


CAGGCGCTCT 


AAATGAAAGC 


TTTTCAGATG 


TTTTTGGATA 


CTTTGTAGAT 


GACGAGGATT 


480 


TCTTAATGGG 


TGAAGATGTC 


TACACACCTG 


GAAAAGAGGG 


AGACGCTTTA 


CGCAGCATGT 


540 


CAAACCCAGA 


ACAATTTGGT 


CAACCAGCTC 


ATATGAAAGA 


CTATGTATTC 


ACTGAAAAAG 


600 


ATAATGGTGG 


CGTACATACG 


AATTCTGGAA 


TTCCAAATAA 


AGCAGCTTAT 


AACGTGATTC 


660 


AAGCAATAGG 


GAAATCTAAA 


TCAGAACAAA 


TTTACTACCG 


AGCATTAACG 


GAATACTTAA 


720 


CAAGTAATTC 


AAACTTCAAA 


GATTGTAAAG 


ATGCATTATA 


CCAAGCGGCT 


AAAGATTTAT 


780 


ATGACgAGCA 


AACAGCTGAA 


CAGGTGTATG 


AAGCATGGAA 


TGAAGTAGGC 


GTGGAGTAAA 


840 


AATATATAAA 


CaAGAAGAAG 


TAATGTTAAA 


CACTTATAAA 


TAATTAAATT 


TTAAATACAG 


900 
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ATTAGATGAG AGGAGTGTGA GGGTTGTCTG CCGAAAGACT ACTCGGCAGT CTAAAATCAT 1020 

TACAAGTAGT AGATATGTGA TAATTAAATG CTGACTTAGA ATACAAAATT CATTTTAAAA 1080 

GTTGTCACAA AAAATTTACA TGTATTTTTA TTATCTTTTG CAAAACAAAG TGTTAAATTA 1140 

TAAATGAaAC ATGCATGAAT TTATTTTTTA ATACAAGAAA CGTAACTACC AAAGGAGTTT 1200 

ACAATATGAA GAAAAGTAAA CGATTAGAAA TTGTTTCTAC AATAGTTAAA AAGCATAAGA 1260 

TTTATAAAAA AGAACAAATc ATTTCATATA TTGAAGAATA TTTTGGTGTA A 1311 



(2) INFORMATION FOR SEQ ID NO: 495: 

j 

(i) SEQUENCE CHARACTERISTICS: 
15 (A) LENGTH: 1761 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 

20 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 4 95: 
TGCACTTTCT AAAAATACTT GCTTTACTTG TTCCAATTCC TTGTCAGACA TTGATTCGGC 60 

25 TAATTTATTC ATTATTGCCT CAAATACGTT AATTATGTCA TCCATTTCAG TACTATAAAA 120 

ATCAAACCAT TTTGCCGTAT CTTTTTCTCT ATTAAGCTTA TGATCACTTT GAGAGCGCTT 180 
AGCTAATTCT GCATAAATAT ATGGACAAGG TGCCATTGCA GCAATTGTAT AAATAGCATT 240 

30 TTCACGACTA TGCGCTTGGA AATACATATG TTTTATGTAA TGGTCGCCAC TTGGAGGCCA 300 

AACTTTTGTT TTAATGATTT CTTCGTATGA TTCACCAACA ATTTGCGCTA AAATATCATG 360 
CGCAAGTACT TCACCTTCAA CCATAAATTC TATTTGCTCT ACTAAAAATT TTACGTCATT 420 

35 CATGCTATTC ATTTTTGGAA TTAACAAAGC ATATAAGTTT GTAAATTCTT TTAAATACGC 4 80 

AGCATCAGCT TTTAAGTAAT GGCGTAATGC GTCAGcTCCT ATATCTCCGG ATAACATCTT 54 0 

CTGAATAAAG TCATCCTCAT AAATATCATT AATGATTGGC TTTGCAGCTT GGTACAATTT 600 

40 TTGTGAAAAT TCCATTGTAA AAAATCCTCC CTAAATAAAA AAACTACTTC CAACATGAAA 660 

GTAGTTTGAT GGCAATGTTG CTATACTAGC CCCATCACTT CAATAACTAC TTTCCTACGT 720 
TGGTACTAAC CAAATCAGGT CATAAGGGTC TGAACAATTC ATCTCAGCCA TATCATTAGG 780 

45 

CTCCCCTAGT AGTTCCTTAG TATTCAATTG CAAATTAATC TTAGCAAACG GTTTCAACAT 840 
TTTCAATTAT TGTTGCTCAG TTGTATTATT ATCTTTAAAT AATAATTCTA TAATGACATA 900 
TATTTGCGAA ATAAAAAAAC CGGAACATAT CGAGAATTCC CCGATATATT CCAATCTAAA 960 

50 

AGTTACTTAT ATAACTATTA ATTAGCTATG. CATAAATGGC TTATGCAGTA ACCCAATGTC 1020 

. 55 



1421 



EP0 786 519 A2 



5 



10 



15 



20 



TTGCTGGTGA 


TACACCTTTA 


TATTTAGCAG 


GTGCTACTGA ATCCCAAGTT 


GATTGTAAGA 


1140 


ATTGATACTT 


ACCAGCTGCA 


CCTGgATGTT 


GGrTTTACAG 


CATGAATATT 


GCCACCTGaT 


1200 


TCACGTTGrG 


CAATTTGTTT 


TAGATGAGCa 


TTCACATTTA 


CTGATGAACC 


TTCTGATGAT 


1260 


TTTGATyCAG 


TTGGTGTTGC 


AGTAACTTGT 


GAATTGTTTG ATGTTGATGC TTGTGGTTGT 


1320 


TGAGTTTGAG 


CATTTTGTGG 


TGCTTCAACT 


TCTTGTGATT 


GTACTTGATT 


AGCTTGAACA 


1380 


GCTGATGGTG 


CAACATTATT 


AGTTGCAGGT 


GCTTGTGCAC 


TCATGTCTGC 


TCCATTAGTA 


1440 


CCTGTTGCAT 


GGTAATTCCA 


AGCAAAGTGT 


GTACCATCTG 


ATTCAAAGTG 


ATAAGTAAAC 


1500 


CCTTCATAGT 


CAAATGTATA 


ATTATAAGCC 


CCAGCTTCAA 


TTGGTTTTTG 


ATTTAATGTT 


1560 


TGATCATTTG 


ATTGCGCCAT 


TTGCCTGAAA 


GATGCTTTAT 


TTAAGTCCGC 


TTCACnTGCA 


1620 


TGGGCTTCGT 


GGACCTGCAT 


TTCCTGGCTA 


CGATTCCTAA 


ACCTACTGGC 


nAAnGATGAT 


1680 


GCGAGTAATG 


TTTTCTTCAT 


AATCTTAAAA 


TCCTCCTACA 


AGTGAATTTG 


TGTCTCTAAA 


1740 


AGTTTTACAG 


TGGACGACTG 


T 








1761 



(2) INFORMATION FOR SEQ ID NO: 496: 

• (i) SEQUENCE CHARACTERISTICS: 
25 (A) LENGTH: 794 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

30 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 496: 



45 



SO 



TCATTTATGA 


AAAATGTCGG 


AnAGAnCCaa 


GaAAmaCAAT 


TGAgCGTGAA GAAAAAGCAA 


60 


GACTTAAAGA 


AGAACAAAAG 


GCACGTCAAA 


ATGAACAGCC 


ACAAATAAAA 


GATGTGAGTG 


120 


ATTTTACGGA 


AGTGCCTCAA 


GAAAGAGATA 


TTCCAATTTA 


TGGGCATACT 


GAAAATGAAA 


180 


GTAAAAGCCA 


GAGTCAACCA 


AGTCGAAAAA 


AACGAGTGTT 


TGATGCAGAG 


AATAGTTCGA 


24 0 


ATAACATCGT 


AAATCATCAT 


CAAGCAGATC 


AGCAAGAACA 


ATTAACAGAA 


CAAACTCATA 


300 


ACAGTGTTGA 


AAGTGAAAAC 


ACTATTGAAG 


AAGCTGGTGA 


AGTTACGAAT 


GTATCGTATG 


360 


TTGTTCCACC 


GTTAACTTTA 


CTTAATCAAC 


CTGCAAAACA 


AAAAGCAACA 


TCTAAAGCTG 


420 


AAGTGCAACG 


TAAAGGACAA 


GTACTAGAGA 


ATACATTAAA 


AGATTTTGGG 


GTAAATGCAA 


480 


AAGTGACACA 


AATTAAAATT 


GGTCCTGCAG 


TAACTCAATA 


TGAAATTCAA 


CCAGCTCAAG 


540 


GGGTTAAAGT 


GAGTAAAATT 


GTAAACTTGC 


ATAATGATAT 


TGCATTAGCT 


TTAGCAGCAA 


600 


AAGATGTTAG 


AATCGAAGCG 


CCAATACCTG 


GTCGTTCTGC 


AGTAGGTATT 


GAAGTGCCAA 


660 
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ATAAACTAGA AGTTGGATTA GGaAGAGATA TATCAGGTGA TCCAATTACT GTTCCACTAA 780 
ATGAAATGCC ACAC 794 
(2) INFORMATION FOR SEQ ID NO: 497: 

<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1161 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 497: 





AGCCAGTTTT 


GcATTTCGTC 


AAATCGCAAT 


GAATATATTG 


ATTGCTTGTC 


AAAATTTGGA 


60 




AGAAATTTAT 


TCTTCTTTTT 


CTTTTCAGCA 


GTTATCATTC 


CTAATTGTCC 


TTTCTTTTTA 


120 


20 


TCTTAGTGAT 


AAAGAATCCA 


TCTGAATTAA 


AGTCTTGCGG 


CATGATTTGT 


AACGTTTTGA 


180 




CCAACTCTCC 


AGTTATCGGA 


TGTTGAAACG 


GTTCAAATTC 


GAAGTTTTTA 


TTATTTTTCA 


24 0 




AAAACGTATA 


AATCACGTTT 


TCATTTTCTA 


GTTGCTCAAT TGTACATGTT 


GAATAGATGA 


300 


25 


TTTCTCCACC 


TATTTTTACA 


TTGTTTTTTA 


CATTTTCCAA 


TATTTCAAGC 


TGTAATTCAA 


360 




CTAGTGACTC 


AATATGTTGT 


TTGCTTTGAG 


TATACTTAAT 


CTCCGGCTTA 


TGTCTCATTA 


420 




CACCTAATCC 


GCTACATGGT 


GCATCAACAA 


GTATCTTATC 


GTATGTTTTA 


TCATAAGGTT 


480 


30 


TTGTCGCATC 


ATGTTGAAAA 


GCTTTAATAT 


TTGTTAATCG 


TAATTnTTTT ATATTAAAAT 


540 




TAATTAAGTC 


TATTTTGTGA 


TCATGTATAT 


CTGAAGCGTC 


AACTTGCCCT 


TCTGGCATTA 


600 




AAACTTCAGC 


AATGTGACAA 


GCTTTACCGC 


CAGGTGCACT 


ACATGCATCT AATACGTGAT 


660 


35 


CATGTCGGTC 


TACATTCATA 


ATGTGTGCAa 


CAAACATTGA 


GCTTTTATCT 


TGAATTGAAA 


.720 




CGAATCCATC 


TTTAAATGAA 


CGAGAATGAA 


TAATTGGTTG 


TCCTCCTATA 


TGGAGACAAT 


780 




AAGGTAAGTC 


ATGATCTTTT 


TCAACGTCAT 


AACCTTCGTC 


TTGCAACTTT 


TCAATAATAT 


840 


40 


CATCTAATGA 


TGCTCGCGTC 


AGGTTGGCAC 


GCACAGTTGT 


TGATGTCGTT 


TCTAAAAATG 


900 




ACTGTAAAAT 


TTTTTCAGTT 


TCTTCGAGAC 


CATAATGTGT 


TGCCCAATGA 


TCTATAATCC 


960 


45 


ACTTCGGCAT 


ACTATACTCG 


ATTGCCATTC 


TrrmTAGG 


ATCTGCAATT 


TCATTAAAAT 


1020 


CAGGTAAGTC 


ACTACGCATC 


ATTGTACGTA 


AAATACCATT 


TACGACATTA 


CCATTATGAT 


1080 




AGCCACCGCG 


TTCTTTTGCT 


ATTTCAACTG 


CTTCATTAAT 


AATGGCATGA 


TTTGGAACTT 


1140 




TATCTAnATA 


nACATATTGA 


T 








1161 



<2) INFORMATION FOR SEQ ID NO: 4 98: 
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(A) LENGTH: 1504 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
<D) TOPOLOGY : linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 498: 

AGCTCACGTC ATCTTCGGCG GCGCTAAATT AAAATAATCA ATTTCTGAGT TAAACTTTTA 60 

TTTACAACAT ACTATTACTA TACATTACAA ATTTTTAAAA TATACATTAC ACTCATTACT 120 

CAATGGmAAG CGTATGATTT CmCAGCCCCC CTAGCTTGTA GAAATCATAC TTTCCTTTTT 1B0 

15 TCAATATATA TACAACTATT AAATCCCATA AGATTGCAGA GCACATAAGT AAATTTTTTT 240 

AGAGCTTGAG GTTTGTTTAG CTTAAGCAAC CCATGAGCTC AAACACTTCC TGTTCACATA 300 

ACACTACAAA TCGCATTATG TTGCTTAATC TTATGTTTAT ATAAATTACA CACAATAAAT 360 

AGAAAGAATG TGAACATCAT GAATAAATTA TTGCTACTCG TTACATTTAT CATTCGTGTG 420 

GGTTCAGGTA TTGTTATGTT AATGCAAGGC TACGAAAAAT TAACGGGCGG ATTTACGCTG 480 

AAAGGTTTAG TACCAGTCAT CGCTAACAAT ACTGATTCAC CAGAGTGGTA TAAGTGGTTT 540 

TTCGCAAATA TAGTTGCACA TACGACGTCA TTATTTGATA TTGTTGTCCC ACTCGGAGAG 600 

ATTGCAATTG GATTAGGTTT AATTTTTGGA GTTTTTGCAT ATGCTGCTAG TTTCTTTGGA 660 

GCCTTTGTTA TGATAAATTA TATCTTAGCA GATATGATAT TTACGTATCC TCTTCAATTA 720 

ACTTTCTTTA TCCTTTTACT AATGAGTCAC TCATTGTTAA AACAGATTTC ACTTAAAGAA 780 

ATCATTAATT ACTTTAGAGG TCGTAAGAAC AGAGGTGAAA AAATAGATGA CCCACTTACT 84 0 

35 GATCGTGGAT GATGAACAAG ACATTGTAGA CATTTGTCAA ACCTATTTTG AATATGAAGG 900 

TTACAAAGTA ACAACGACAA CTAGCGGTAA AGAAGCAATT TCTTTACTAT CAAATGATAT 960 

TGATATCATG GTACTTGATA TCATGATGCC AGAAGTTAAT GGTTACGACA TTGTCAAAGA 1020 

AATGAAAAGG CAAAAATTAG ATATCCCCTT TATCTATTTA ACTGCCAAAA CACAAGAACA 1080 

TGATACCATT TACGCCTTAA CTTTAGGTGC AGATGACTAT GTCAAAAAAC CATTTAGTCC 114 0 

AAGGGAACTC GTTTTACGTA TTAATAATTT ACTTACAAGA ATGAAGAAAT ACCATCATCA 1200 

ACCAGTTGAA CAACTGTCGT TTGATGAATT AACACTTATT AACTTAAGTA AAGTtGTGaC 1260 

tGTAAaTGGT CACGAaGTCC CTATGCGTAT TAAGGAATTT GAGTTATTGT GGTATTTAGC 1320 

TTCTAGAGAA AATGAAGTTA TTTCTAAATC AGAATTACTT GAAAAAGTTT GGGGATATGA 1380 

CTATTACGAA GATGCTAATA CCGTGAATGT CCATATACAC CGTATTAGAG AnAAATTAGA 144 0 

AAAAGAGAGC TTTACAACAT ATACCATCAC AACTGTATGG GGATTAGGAT ATAAATnTGA 1500 

55 
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(2) INFORMATION FOR SEQ ID NO: 499: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1623 base pairs 

(B) TYPE: nucleic acid 

(C) STRANt)EDNESS : double 

(D) TOPOLOGY; linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 499: 
ATTGAAAGCG ATAATTCGTA nTAATTGAGT TTGTTGAAAA ATTTAGGGTA ATGTAAAGAT 
ATAAAAGATA CATAGAyTGG AGAGATATAA AGATGTTGAA TGAGATACAA ATATTAaATA 
aTGGATACCC GATGCCTTCA GTTGGGTTAG GTGTTTATAA AATCTCTGAC GAAGATATGA 
CTAAAGTTGT AAATGCTGCA ATTGACGCAG GCTATAGAGC GTTTGATACA GCATACTTTT 
ATGATAATGA GGCTTCACTA GGACGAGCAT TAAAGGATAA TGGCGTCGAT AGAGAAGATT 
TGTTTATAAC AACGAAGTTA TGGAATGACT ATCAAGGTTA TGAGAAAACA TTCGAATATT 
TCAACAAATC GATTGAAAAT TTACAAACTG ATTATCTTGA TTTATTTCTA ATACATTGGC 
CTTGTGAAGC AGATGGTCTA TTTTTAGAAA CATATAAAGC TATGGAAGAA CTTTACGAGC 
AAGGTAAGGT AAAAGCAATA GGTGTATGTA ATTTTAATGT TCATCATCTA GAAAAATTAA 
TGGCTCAATC AAGTATCAAA CCAATGGTGA ATCAAATTGA GGTACATCCA TATTTTAACC 
AACAAGAATT ACAAGAATTT TGTGATCGTC ACGATATTAA AGTGACTGCA TGGATGCCTT 
TGATGAGAAA TAGAGGACTA CTAGACGACC CTGTCATTGT TAAAATTGCT GAAAAATATC 
ATAAAACACC AGCACAAGTT GTATTACGTT GGCATTTAGC ACACAATAGA ATT ATTATTC 
CAAAATCTCA GACACCTAAA CGCATTCAAG AAAATATAGA TATTTTAGAT TTTAATTTAG 
AATTAACAGA AGTAGCTGAA ATTGATGCTT TAAATAGAAA TGCAAGACAA GGTAAAAATC 
CAGATGATGT GAAAATTGGG GATTTAAAAT AACTGGATGT TAAATTTTAC GTTTATGAAT 
GCCTTTTAAT GTGTACATTA AAATAAATGA GTTGGTTTTT ACTATTTGAT AAAACAATAC 
TCAGGTACAT TCAAAATCTT TTAAATAAAA AGGATGGACA TAGATGAAAA TTAGAGTCGT 
CATTCCTTGT TTTAATGAAG GGGAAGTCAT TACACAAACA CATCAACAAT TAACTGAAAT 
ACTTTCACAA GATAGTAGTG TGAAAGGCTA TGATTATAAT ATGCTTTTCA TAGATGATGG 
TAGTACGGAT ACCACTaTAG ATGAAATGCA ACATCTTGCC ACAATAGATA GGCATGTCAG 
CTTTATTTCT TTTAGTAGAA ATTTTGGAAA AGAAGCAGCT ATGATTGCAG GTTACCAGCA 
TAGTACTGAA TTTGATGCAG TCATCATGAT AGATTGTGAT TTGCAACATC CACCTGAATA 
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TAGAAGTGGT GAAAATTTTA GTCGCAAAAC ATTAAGCCAT TTGTATTATA AGTTAGTTAA 1500 

TTGCTTTGTA GAAGAAGTAC AATTTGATGA TGGTGTTGGT GATTTTAGAC TTTTAAGCCA 1560 

AAGAGCTGTT AAATCCATTG CATCACTTGA AGAATATAAT CGnTTTTCAA AAnGGnTATT 1620 

TGA 1623 

(2) INFORMATION FOR SEQ ID NO: 500: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: €05 base pairs 
<B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 500: 

20 AAAGTnGGTG AAnCTATATA CTTAATCTAT ATTTATATAT TAACCATTAG GGTTAAAAAT 60 

TACTCTAGCA TTTATGAATA GATGGGAGTT TATTTTATTA TTATATAGGA GAGATGTTGA 120 

ATGACACATC GCGCACTATT AGTTGTTGAC TATTCATATG ACTTTATCGC AGACGACGGC 180 

TTACTAACAT GCGGTAAACC TGGACAAAAT ATTGAAGATT TTATTGTTTC TCGTATCAAT 24 0 

GACTTTAATT ATTATCAAGA CCATATATTC TTTTTrrTGG ATTTACATTA TTTACATGAC 300 

ATTCATCATC CTGAAAGTAA ATTATTCCCA CCACACAATA TCGTAGATAC AAGTGGTAGA 360 

GAATTATACG GTAAAGTAGG TAAATTATAC GAAACAATTA AAGCGCAACC TAATGTACAT 420 

TTCATTGATA AAACGCGCTA TGATTCGTTC TTTGGTACCC CGCTTGATAG TTTATTGAGa 480 

GAAAGAAGTA TTAATCAAGT CGAAATCGTT GGTGTATGTA CCGATATTTG CGTGTTACAT 540 



ACAGCAATTT CTGCATACAA CTTAGGtTAT AAAATTTCAG TACCTGCTGA GGGAGTGGCT 600 

) 

CATTT 605 
<2) INFORMATION FOR SEQ ID NO: 501: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1739 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 501: 
TAGGTTnAAA GCATAGnTTT nTCAAAAAGA CAAATCATTC ATATATTGGA GGATATTTTG 60 
GTGTAAGATA TAGTGCAACC ACAATTGCTA AAGACTTGAA GGAACTAAAT ATATATCGTG 120 
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TGAGAGAAAA 


GTTTAGACAC 


TATTGTGAAC 


ATGAAGTTCT 


AAGTTCAATC 


ATCAATGGTT 


240 


CATACATTAT 


CGTCAAAACC 


TCACCTGGTT 


TCGCCCAAGG 


CATAAACTAT 


TTTATCGATC 


300 


AGCTAAATAT 


AGAAGAGATA 


TTAGGTACGG 


TGAGTGGAAA 


TGACACTACA 


TTAATCTTAA 


360 


CTGCCTCAAA 


TGATATGGCA 


GAATACGTAT 


ATGCAAAATT 


ATTTAAATAG 


ACATGTATCA 


420 


AATGAATAAT 


AAAAATTTGT 


TTCGTATCAC 


GTGTACTCAA 


GTTAGTTACC 


AAATATTAAG 


480 


TTGTGTACGC 


GTTTTTTTAT 


GGAAAGAAAG 


AATTCATAGT 


CATTCAATTG 


ACTGTATAAA 


540 


AAACTTTATA 


CAACATGTTT 


TTATGGGTAT 


TTTTGAATAA 


AAAATGTATA 


TTTTGACCCA 


€00 


AAATACCTTT ATTTATGTAT AAAAATCCAT 


TATTATGTAT 


TGTATAACAA 


AAAGATATGA 


€60 


AATTTTCGAC 


TTTCTTTATG 


TGAATATAAT 


CACATGTAAG 


CGTTTGAAGA 


TTGTCTATAC 


720 


TCTAAATGAA 


TTCAAAGATA 


AAAGGAGGAA 


ATAGACATGA 


CAGATGGTCC 


AATTAAAGTA 


780 


AATAGCGAAA 


TTGGAGCTTT 


AAAAACTGTG 


TTACTTAAGC 


GTCCTGGaAA 


AGAATTAGAA 


840 


AATTTAGTAC 


CTGATTATTT 


. AGATGG ATTA 


CTATTTGATG 


ATATTCCATA 


TTTAGAAGTA 


900 


GCTCAAAAAG 


AGCATGACCA 


TTTTGCGCAG 


GTGCTAAGAG 


AAGAGGGTGT 


TGAAGTACTT 


960 


TACCTTGAGA 


AGTTAGCAGC 


TGAAAGTATT 


GAAAATCCTC 


AAGTAAGAAG 


TGAATTTATT 


1020 


GATGATGTAT 


TAGCAGAGTC TAAAAAAACA 


ATATTAGGTC 


ATGAAGAAGA 


AATTAAGGCA 


1080 


TTATTTGCGA 


CACTTTCTAA 


TCAAGAACTT 


GTAGATAAAA 


taatgtcagg' 


GGTACGTAAG 


1140 


GAAGAAATTA 


ATCCGAAATG 


TACAGATCTA 


GTAGAGTATA 


TGGATGATAA 


GTATCCATTC 


1200 


TATTTAGATC 


CAATGCCAAA 


CCTTTATTTT 


ACTAGAGATC 


CACAAGCCTC 


AATAGGACAC 


1260 


GGTATAACAA 


TCAATCGGAT 


GTTCTGGAGA 


GCACGACGAC 


GAGAATCAAT 


ATTTATTCAA 


1320 


TATATTGTAA 


AGCATCATCC 


TAGATTTAAA 


GATGCGAATA 


TTCCAATCTG 


GTTAGATCGA 


1380 


GATTGCCCAT 


TCAATATTGA 


AGGCGGCGAT 


GAACTTGTTT 


TATCTAAAGA 


TGTCTTGGCT 


1440 


ATAGGCGTTT 


CAGAACGTAC 


ATCTGCACAA 


GCTATTGAAA 


AGTTAGCGCG 


ACGTATTTTT 


1500 


GAAAATCCGC 


AGGCGACGTT 


TAAAAAAGTA 


GTAGCAATTG 


AAATTCCAAC 


TAGTCGAACT 


1560 


TTTATGCACT 


TAGATACAGT 


ATTTACAATG 


ATAGATTATG 


ACAAATTTAC 


AATGCATTCA 


1620 


GCCATTTTAA 


AGGCAGAAGG 


CaATATGAAT 


ATATTTATTA 


TTGAATATGA 


TGACGTAAAT 


1680 


AAAGATATTG 


CCATCAAACA ATCTAGTCnT 


TTAAAAGATA 


CTTTAGAAGA 


CGTACTAGG 


1739 



12) INFORMATION FOR SEQ ID NO: 502: 

50 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1745 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 
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<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 502: 

CTGTACATAC AGCAATATCG TTAACAAATG AAAACAGTAT TTTAGGATTG TAAACCATGA 60 

TAAACCTAAA ATACTGTTAT TTTTATTACT TAAATTTCTT CTTCAATGCC TTTTCAACAT 120 

AAGGTGGAAC GAATTCAGAA ATATCTGCTC GATAAGCTGC AACTTCTTTA ACAATACTTG 180 

AACTTATAAA TGAATAATTA GTACTAGACA TCATATATAA CGTTTCAATT TCATTGTTCA 240 

ACTTTTTATT CATTGAAGTT AAGCGTAATT CATATTCAAA ATCACTGACT GCTCTTAAAC 300 

CACGTATGAT TGTTTTAGCT CCTACTTGTT CACAATAATC GACTAGTAAA CCACTAAATT 360 

GATGAACCTT GACATTAGGT AAATGTTTAA CAGATTGTTC AATTAAATCC ATACGCTCTT 4 20 

CTAAACTAAA CGTACCTTCT TTTTTACTAT TTTTAAGAAC ACAGACATGA ATTTCATCAA 4 80 

20 ATCTATCTGT ACTTCTCTCA ATAATGTCTA AATGACCATA AGTAATGGGG TCAAAACTAC 540 

CCGGAATGAC CGCTATTGTA TGTTCCATGC TATTCTCCCT TTTCTAATAA CAATGTGTCT 600 

GTCAACCCAT AATGGTAACG TTTAATCATA TTAAACGGTT GATAATCtAT TTCTTCATGA 660 

25 TTGCTAAATT CACAAACGAT GATACCATTT TCTTTCAATA AATTAAACTC TGAAATTAGT 720 

TTTAAAGCTT TATCAATGAG ACCTTTATTA TAAGGTGGAT CTAaGAAAAT GACATCAAAT 780 

TGAATATCAC GTTTTGACAA TGCTTTTAAA GCTCTATCTG CATTATTTTT ATAAACTTCA 84 0 

GATTGTGCCT CTAAATCCAA ATTCGCAAGA TTTGaTTTAA TAACTTTTAC AGCTTTAAAA 900 

TTTTGaTCAA CAAAGATTAC CTTATCCATA CCTCGAGAGA GTGcTTCTAT TCCAAGCGCC 960 

CCGCTTCCTG CAAATAAATC TAAACCTATA CCTGACACAT CATATAAACT ATTAAAGATA 1020 

CCTTCTTTAA CTTTATCCAT AGTTGGTCTC GTATTACGGC CTTCCATACT TTCTAAAGCT 1080 

TTACTTTTAT GTTTACCTGC AATGACGCGC ATGTTGTTCA CACTTCCAAT TCATTTAGTT 1140 

ATTTAATATA ATTTATTGAG AAAAAGGAGA ATGATAAACC AATGAAACAA ACATTTATTA 1200 

CACTTGGTGA AGGTCTAACA GATTTGTTCG AATTCATGAC GATGATTGAA TATAACCATC 1260 

AACGTATTGA TAAAATTATC TATTTTCATT CACCACAAGC TGAAAATAAA AAGTCATCTG 1320 

45 TAGCAATCAT TATGAACCCT ACAACTGGCA ATCATTTCCA AGCATTTTAT ATCATGATAA 1380 

ACGCTATTAA ATATCCATAT CCAGATTCAA ATAAAAAGTT TCAAATGATA AATGATTGTG 1440 

CTGAAAAATT CGACATACCA ATTTTAGGTA TCGATGTACA GCCCCCTCAA GCATTTCATG 1500 

SO 

ATTTATCGTT ATATTATAAT TATTTAATTA GTGTGTTAAG GCTCCAAAAA TGGATACCAG 1560 

aACTTCAATA ATATTAATTA TATATTTCGT GTTTCTCTTT TTCGTAAGTT TTCTTTAAGT 1620 
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TTTGATCAAC ATCTTGCTCA TTCACATACA TAATTACAAA TTTACGATCT CTATTTGAAT 1740 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1284 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 



1745 



GAACG 

5 

(2) INFORMATION FOR SEQ ID NO: 503: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1035 base pairs 

(B) TYPE: nucleic acid 

10 (C) STRANDEDNESS: double 

<D) TOPOLOGY: linear 



IS <*i) SEQUENCE DESCRIPTION: SEQ ID NO: 503: 

TCGTCTTTAA TCTTGCTGAC TTTAGAAGGC TTACGAGTGC GGTTACCATT TTTTGCATCT 60 

TTAACTGATT GAACTAAAGC TtGACGTGTA GATTTATCAG CTAAACTAAT TGCACCACCA 120 

20 ATTACGGCAC CAATTAAAAT ACCAGGAACA AATTTATTTT CCATAAAAAA CTACCCCTCT 180 

TTCAAATTTG CATCTTTTAC GATGTAGTCT ATTAAATTAT CACAAGATGA TAATACCATG 240 

TCGTATACAC CTTCAAAATT ATTCGTGTAG TATGGATCTG GTACATCACT CTCTTCCATA 300 

TTACTAAATT CTAACAGTTT GAACAATTGT CCCTTAAGAT TAGGATTGAT AGATTTAATA 360 

TTATCAACGT TACTTTGATC CATAGCCACA ATGTAATCAA AATCATCTGT CGCTTCGAAT 420 

AATTCACTAA TCATGCCATC AAATGGAATA TTGTGTTTGT TGAGAATTTT TTGTGTACCT 4 80 

TCATGAGGTG GCTCTCCTAA ATTCCAGCTA CCAGTACCTC TTGAATGTAC TTTAATATCA 54 0 

TGAATATTTC TGTCTTTAAG TCTTTGTCGC ATGATTGCTT CTGCCATTGG AGAACGACAT 600 

ATATTGCCAA GACAGACAAA TGCTACATCT ACCATTTTGA TTCCTCCAAA CTATGTAGTT 660 

ATATCCCCAT TTTATAGCGA CTTTAAACAA TAAGAAAGCA GATTATATAA AATTCTATTA 720 

AAGTTTATTA AATTGTGATA CTTTGATAAC ATAACTATTA TTAGAGGTGA ACATTGTGGC 780 

40 TATGACAAAT GAAGAGAAAG TnTTAGCTAT TAGAGAGAAG TTAAATATtG TTAATCAAGG 840 

ATTATTAGAT CCTGAAAAAT ATAAAAATGC AAATGaAGAA GAATTAACAG ATATATATGA 900 

TTTTGkTCaA yCAAGAGaAA GATTGTCGCC AAGTGaAGTG mCAGCTATTG CTGaCGCTTT 960 

AGGACAATTG CGACACGAAT AGGAGTGGGA ATTTTGACTA ATTACAAAGA AAAGTTACAA 1020 

CAATACGCTG AACTA 1035 
(2) INFORMATION FOR SEQ ID NO: 504: 
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10 



15 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 504: 

AnCCTGACAA GATTCTTATA TT CAT AG AT A TGAGAGCTAA AAATGAAATC AACAAACAnA 60 

CAATAAAGTA AACGATAATA GCCCATATAC CATTTTGTAA CCATATTACA AATTGTGTTG 120 

TATTATAGCC ATTTCCAGCT AATAATTGCT GGATAAATGC ATTATTGTTT AATGTATTTT 160 

CAAGATTAGC AAtCGATGTG TTATTACTGA ATGAAACAAG TGCTATAAAC ATCGTAATGA 24 0 

CAGTAAGCAC TAATAACATC ACCCAACATA ACCAACCTAG AACTTTTTCA GTTAATCTAC 300 

TTACTGGACG TTTAATTTGA GTAAATTGTT CTCCAGTCAT TCGTTACAAC TCCTTATAGT 360 

ACTTATCCCG TTATTATAAC TAAATATACA GTAAATAACT ACTATTTATG ATTTTATTTT 420 

AATGACATTT TGAAATTCAA AAAGTTTTCA TTGTATTCAC TTAAAACTTC AGGTCCTAAA 4 80 

20 TCTTTATAAA CTTCAAGGCG TTCTTGCTCT TTCTTAGTCG GATAAAAACG ATGGTCGTCT 540 

TTAATCTCTT TAGGCAACAA TTGTCGAGCA GCCTTGTTTG GCGTTGCATA GCCTACGAAT 600 

TCTGTATTTT GCTTGTTATT TTTAGCATCT AATAAAAAAT TCATAAATTT ATATGCACCC 660 

TCTTTATTTT GTGCCGTTTT TGGAATTACC ATATTGTCGA ACCATAAATT CGATCCTTCT 720 

TTAGGAATAA CATAATTATA TTTATCCCCT TCTTGCACTA GAGGTGCTGC AACACCACTC 780 

CAAACAACCG CTATGTTACC TTCATTTTGT TGAAGCATCA TGGTAATTTC ATCACCTACG 84 0 

ACACCTCTTA CTTGTGGTGC TAGTTTGGTT AAATCTCGCT CTGCTTCTTT TAAATGGTGC 900 

GAATTACGGT CATTAAGATT ATACCCAAGT TTATTCAAAC TCATGCCTAT AATCTCTCTA 960 

GCACCGTCAA CTAGTAAAAT TTGGTTTTTA AATTTAGGAT TATACAATGA CTTCCAACTA 1020 

TCAAATGATT CATTTGGATA CTTTTCTTTA TTATATAAAA TACCTACAGT TCCAAAGAAA 1080 

TAAGGTAAAG AATATTTATT GCCTCTATCA AATGACATAT TCATATAATC TGAATCTAAA .114 0 

40 TTTTTAATAT TAGGTACCTT ATTATGATCT ATTGGTAACA ATAAATGATC TCTTTTCAAT 1200 

TTTTGAACTG nATATTCACT AGGAnAAGCA ACATCATAAT GTGTACCGCC AGTGCGAATT 1260 

TTGGnGTCCA nCGCTTCATT TGAA 1284 
45 (2) INFORMATION FOR SEQ ID NO: 505: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5763 base pairs 

(B) TYPE: nucleic acid 
SO (C) STRANDEDNESS : double 

(D) TOPOLOGY : linear 
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ATAATTAACA TCTTTTGCTA TATACCACCA GTTTGATACA TAAAATATCG CAGCAATAAT 60 

ATCATGTTTA ACCCTAATGA TATTATCTGA TTTTAATAAT AAGGTTGCTG TCCCTACAAC 120 

5 

CATTAATAAA ACTATGACTG CTGGTAATAA ACGTTTTAAA CGACGTATCC AAAAGCTTTT 180 

CAATTTAATG ATACCTGTGT CATCATACTC TTTGAGTAAT AAGCTTGTAA TTAAATAACC 240 

AGAGATCACA AAAAATGTAT CCACACCTAA AAAGCCACCT GtCAACCATT GCTTATTTAA 300 

10 

GTGGTAAATA ATAATTCCTA GAACAGCGaT TGCCCTCAAA CCATCGAGCC CTGGAATATA 360 

TCTCATTTTC TTATACTTTG TAAAACCCTT TGTTTTGTTC ATTTTTGCAT TCTTCCCTTT 420 

75 TAAAACTGTT CTTCTTAGAT GCTTAATTAA ATTTAGTTAT GCTGTTTAAA AGAATATTGA 4 80 

AATGCATATG TATATTATTG AATTACGACA TCATCAAAAT CATATTGACT AAAATACTGT 540 

TAAATTAAAA AAATTACCAA TGATGATTCT TACTTCGAAA TCCAATTTGT AATGCAACTC 600 

20 GGCAACTTAA AAACTATGAA GTATTATGTA TTGTAATATA ACTGTAATAT AAATTCAATT 660 

TATTATAAAA ATTTTCAAGA AAATATTCAA CTAGAAAATG AATTGTGCAC TCTTGGAAGT 720 

GCAAGTCACT GTCTTAATTC ATATTTTTTG AAACAAGTTA GATATAAATT TTCAAAATAA .780 

25 

AATCAGAAAC TAGAACATAA ATAAGGCTCC CTTCAAAATT TTCATTTTTC AATGTCTACT 840 

TTGAAGGGAG CTTATTCACA ATGAATTATA CTCTACAATG TTATATTGAC TGCGGGCCCA 900 

AACACAGAGA ATTTCGAAAA GAAATTCTAC AGGCAATGCA AGTTTATGTT AGCTGACACC 960 

30 

AAGTGCAATC TTAGCGTAAC GTGACATCAT ATCTTTTGTC CAAGGTGGAC TCCATACGAT 1020 

ATTCACTTCA GTATCCTGAA TTTCAGGAAT CTCTGCTAAT ACTGTTTTAA CTTGaTCAAT 1080 

35 AATTTGAGGT CCCATTGGAC ATCCCATTGA TGTTAAAGTC ATATCAACTG TACATACGCC 1140 

TTCATCATCA ACATTCACTT TGTATACTAA ACCCAAATTA ACGATATCAA TTCCTAATTC 1200 

AGGGTCAATT ACCATTTCTA ATGCACCTAA GATACTATCT TTCAATGCCT CTTCCATCCA 1260 

40 TATCACCTCT TTAATGTCAT ATTATTCATA ATATATCAAA TATCCGACAA AACGCCAATA 1320 

AAATGCTATG ATGTATCTAT ATGAACTAAG CAACTTATGA GGAGAGAGAT ATGCAACCAC 1380 

ATTTAATATG TCTAGACTTA GACGGAACAT TATTAAACGA TAACAAAGAA ATTTCATCAT 1440 

45 

ATACTAAACA AGTATTAAAT GAATTACAAC AACGTGGaCA CCAAATTATG ATTGCGACTG 1500 

GCAGACCTTA TCGTGCAAGT CAAATGTATT ATCATGAATT AAATTTAACG ACACCAATTG 1560 

TTAATTTTAA TGGCGCTTAC GTACATCACC CTAAAGATAA AAACTTCAAA ACTTGCCATG 1620 

SO 

AAATTTTAGA TTTAGGCATC GCACAAAACA TTATTCAAGG ATTACAACAA TATCAAGTAT 1680 

CGAATATTAT AGCAGAAGTG AAAGATTATG TTTTCATTAA CAATCATGAT CCAAGATTAT 1740 
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AAGAATCCCC TACCTCAATT TTAATTGAAG CCGAAGAAAG TAAAATACCT GAAATCAAAA 1860 

ATATGCTTAC TCATTTTTAT GCCGATCATA TTGAGCATCG ACGCTGGGGC GCACCATTCC 1920 

5 

CTGTCATTGA AATTGTAAAA CTTGGTATTA ATAAAGCAAG AGGCATTGAG CAAGTTAGAC 1980 

AATTTTTAAA TATTGACCGA AATAATATTA TTGCATTCGG TGATGAAGAT AATGATATTG 2040 

AAATGATTGA GTACGCGCGT CACGGTGTTG CTATGGAAAA TGGTTTGCAA GAACTTAAAG 2100 

70 

ATGTAGCGAA CAATATTACA TTCAACAATA ATGAAGATGG CATTGGTCGA TATTTGAATG 2160 

ATTTCTTTAA TTTAAATATT AGATATTACT GTTAATTTAT AACTAATGAT TTTATAATAT 2220 

75 TTTAAAACAA TAGGAGGTAA GTTACGATGC CCAAAATAGT CGTAGTCGGA GCAGTCGCTG 2280 

GCGGTGCAAC ATGTGCCAGC CAAATTCGAC GTTTAGATAA AGAAAGTGAC ATTATTATTT 2340 

TTGAAAAAGA TCGTGATATG AGCTTTGCTA ATTGTGCATT GCCTTATGTC ATTGGCGAaG 2400 

20 TTGTTGAAGA TAGAAGATAT GCTTTAGCGT ATACACCTGA AAAATTTTAT GATAGAAAGC 2460 

AAATTACAGT AAAAACTTAT CATGAAGTTA TTGCAATCAA TGATGAAAGA CAAACTGTAT 2520 

CTGTATTAAA TAGAAAGACA AACGAACAAT TTGAAGAATC TTACGATAAA CTCATTTTAA 2580 

25 

GCCCTGGTGC AAGTGCAAAT AGCCTTGGCT TTGAAAGTGA TATTACATTT ACACTTAGAA 2640 

ATTTAGAAGA CACTGATGCT ATCG AT CAAT TCATCAAAGC AAATCAAGTT GATAAAGTAT 2700 

TGGTTGTAGG TGCAGGTTAT GTTTGATTAG AAGTTCTTGA AAATCTTTAT GAACGTGGTT 2760 

30 

TACACCCTAC TTTAATTCAT CGATCTGATA AGATAAATAA ATTAATGGAT GCCGACATGA 2820 

ATCAACCTAT ACTTGATGAA TTAGATAAGC GGGAGATTCC ATACCGTTTA AATGAGGAAA 2880 

35 TTAATGCTAT CAATGGAAAT GAAATT ACAT TTAAATCAGG AAAAGTTGAA CATTACGATA 2940 

TGATTATTGA AGGTGTCGGT ACTCACCCCA ATTCAAAATT TATCGAAAGT TCAAATATCA 3000 

AACTTGATCG AAAAGGTTTC ATACCGGTAA ACGATAAATT TGAAACAAAT GTTCCAAACA 3060 

40 TTTATGCAAT AGGCGATATT GCAACATCAC ATTATCGACA TGTCGATCTA CCGGCTAGTG 3120 

TTCCTTTAGC TTGGGGCGCT CACCGTGCAG CAAGTATTGT TGCCGAACAA ATTGCTGGAA 3180 

ATGACACTAT TGAATTCAAA GGCTTCTTAG GCAACAATAT TGTGAAGTTC TTTGATTATA 3240 

45 CATTTGCGAG TGTCGGCGTT AAACCAAACG AACTAAAGCA ATTTGACTAT AAAATGGTAG 3300 

AAGTCACTCA AGGTGCACAC GCGAATTATT ACCCAGGAAA TTCCCCTTTA CACTTAAGAG 3360 

TATATTATGA CACTTCAAAC CGTCAGATTT TAAGAGCAGC TGCAGTAGGA AAAGAAGGTG 3420 

50 

CAGATAAACG TATTGATGTA CTATCGATGG CAATGATGAA CCAGCTAACT GTAGATGAGT 34 80 
TAACTGAGTT TGAAGTGGCT TATGCACCAC CATATAGCCA CCCTAAAGAT TTAATCAATA 3540 
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GTTAGAATTA TGTTGGACTG GTACTACTAT CCAGTCCATT TTTTATGTTT AACATTTTTA 3660 

GAATCAAAAA AGACATAAGG TCTTGGACTA ATAATTGTCC ATGCCTTATG TCATATACTA 3720 

5 

TATGTCTTAT CAATTAGCCA ATACCGAATA ATTTTGATAT AGGsCCTAAC GGTAGAATGA 3780 

CACCTAATAC CATTGTGATG ATAATTAATG CAATTGTTAT CCAAAACATT GTGTGACTTT 3840 

io GTTCATGTCT CTTTCTTTTA GCAATCGACA CTTCCATCAA TCCAACTACT GCAACACCAC 3900 

ACAGCATTTT CAATGTAAGC AACATATGAT TTGCCCCGCC ATTCATAAAT GACTGAATTA 3960 

ATATCCAAAA TCCTGAAATT AACGTCAACA GCATAAATAA GCGTAAAATC ATGTGCAACG 4020 

15 GTTTGAAAAA TGGTGATCTG CCTTGATTTT TTGAAATGTT TAAGTATGTA GCGATAAATA 4080 

AAATAATCGC TAATACCCAA CTTAATATAT GTAAATGTAA CATACTGATT CCCCCCACTT 4140 

TAATTATTTA TATTATTAAA TTAAAGCTTC TTGGGATTAA TACCCACTTG CTTGTAATTT 4200 

20 AATCATGATT TGATTATACA CGAATATATA TTCTACCACA CTTCTATATT TGAGAGGAAG 4260 

AACATGACAT TTTATTCCTT ATTAGAATAT TGTGAATCTG CTGTAAAATA ATCAACTACT 4320 

TCTTAATATC AATATTTCAC TTTCATCTCA AAATGGTAAC ATTATAAATA ATTTATCTTT 4380 

25 

AACACCTTTT TAGAAAAGCA AGAAAAAACT AACCAATCTA TATAAAGACT GGTTAGCTTT 444 0 

TTAAATGATA ATTATTTAGC GATATAAGTT GTCAGCGTTC CAATATTATC AATAGTCACT 4500 

TTAACTTCAT CACCTGGTTG TAAAAATTTA GGTGGTTGCA TACCTGCACC AACGCCTGCT 4 560 

30 

GGTGTACCAG TTGCAATAAT ATCTCCCGGA TGTAGTGCAA CATATTTTGA AATTTCTTCT 4620 

ATTAATTCAT CAATTTTAAG AATCATTTCG CCAGTGTTAC CATCTTGTCT AATTTCATTG 4680 

^ TTAACTTTTG TAACAATATT TACATTTTCA GGTAATGGTA GTTCGTCTTT AGTAACGATA 4740 

TAAGGACCCA TTGGGCAACC GCCAGTTAAA CTTTTTGATA AAAATGCTTG ATCTTGTTCA 4800 

CTTTGTGCTT TGCGATCAGT GATATCGTTA ATAATTGTAT AGCCGTAAAC ATAATCTAAA 4860 

40 GCTAATGCTT TTGGAATCTT TTCACCAGAC TTACCAATAA CAATACCTAA TTCACCTTCA 4 920 

TAATCTAATT GATCAGTAAT ATCTTTATGA TTTGGAATTG TTGCATTATC TCCTGTTAAA 4 980 

GATGACGCTG CTTTTGTAAA TACATATAAT TTTTCCACTT CATGATTTAA TTCGTTCGCA 5040 

45 TGATCTTTGT AATTTCTACC AAAAGCAATC ACATTATTCG GAGGTGTTAC TGGTGGTAAA 5100 

AATTCAATGT CATTAAATGA AATTTTATAG TCTTCAGCTT TGCCGCTATC TTCTGCTGCT 5160 

ACAACTGCTT TACGTACTTG TTCTTGAAAA TCTAAAGTAT GATTTTGTTG TAAACCAGCT 5220 

SO 

AACAATGTTT TAGGATGGAA ATCTCCTTCT GCAAAGTCAG CAAATACTTG TGTTAAATCC 5280 

CATACAGCAT CTTCGCGTTT TACTTTAACG CCATATGAAG TTTTGTCATT ATACTTGAAT 5340 
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TTCGTTATCA AATAACAAAT AAATAAGTAA GACAATTTTG AAAATGAGTT GTGTTCATTC 
TGCTACAAGG ACTTTGCACT TAATCGAAAT TATTTTTTAT TCTTTTGAAA ATCAAAATAC 
TATAGTTGCA ATGTACCAAA TTTGAAGAAG TATAAATAAC CTTTAACTTC TTTATTAAGA 
ATCGTTTGAA GCGTATTTTG ATAATATTTC ATCTGTATCT TATATTTATT TTTTAATTGT 
GTACCAATTT CTTCATCTGT CATCCCACGG CGACGATTAA ATGCATCGGT TTTATAGTCT 
ACAAAATAAT GCACACCATC TTTAACAAAG ATTAAGTCAA TCATACCTTG AATAATTGAG 
ACG 

(2) INFORMATION FOR SEQ ID NO: 506: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 422 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 506: 
CCATATGATT TTGTGCAATA ACTCTTTTTC TTTCTTCTTT TCGTAAAAAG TTGTACATCG 
CTTTTGTGTT TAAGAGACTA TTGTTTTCTT TAGGTTTTTG AACTTCACTC AGTGTATTTC 
TAGTTGTTAA CACTAAAATT CCAACTGTTG TATCTTTGTA TCTAGCCATA ACTTTATTCA 
GATGTTTGTC ATTTGTAATA ACTACGACAT AATTAAACAC TTCATAATAA TCATTAATTT 
GATTATCTAA TCTATCCAGC TTATCTAATT CTGTTTTAAT CTCATAGACA ACGCCTTTGC 
CGTTTAACAA TATAAAATCA GCaATACTTT TCCCTATGGG CATCTCAGAA AGTGCAGTAG 
TTGTATTAAT AGAATGTCGT CCTAGAAGGA GTkTATTAAG TATnGTGTTT TTGTAAAAAT 
AT 

(2) INFORMATION FOR SEQ ID NO: 507: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1188 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 507: 
GCTTATGTAT TCTCAAAATA TTTATGTGAT ACGCAAAGGA GACATGGTTA TTCGACCAGC 
ATTTGATGAT GACGATCAAA GAAACGGTAG TGAAATAATT CGGTTTGACA AAACGCGTAT 
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JO 



TTATCTTGGC AAGAAAGCAG AGACAAACCG CATTACTGGC ATTTCTAGTA AACCACCTAT 24 0 

TTTACTAACA CCATTATTTC CAACTTATTT TTTCCCAACA CATTCTGACA GACAAAATGA 300 

AAATATTTGG TTAAATATGC ATTATATCGA AAGTATTAAA GAATTAAAAA ATCGTAAATG 360 

TAAAGTGACA TTTATTAATA ATGAATCAAT CATTCTTCAT GTTTCATACC ACAGTTTATG 420 

GCATCAATAT AACAATTCCA . TTTTTTACTA TTACATGGTA GATAAACAAT CTCGCATGAT 480 

ATCAAAAAAT CCCGACCAAC CAATAGATTA TAATAAAGCC ACATTGAATG TGTTTGAAGC 540 

ATTGACACGC TATTCTTTAT TTGAAGATAA ATAAATTGTT TATTTTTAAA ATATGCGGAA 600 

1S TGTTTTATAA ATATAGTGTA AATGTTCTGC ATATTTTTTT AAGGTATCTA TTGCAAATTA 660 

ACTTAATCTT GTTATAATAA TATTTGTGCT TGaTATTCAA ACACATACAA ATTAATCCAC . 720 

AGTAGCTCAG TGGTAGAGCT ATCGGCTGTT AACCGATCGG TCGTAGGTTC GAGTCCTACC 780 

20 TGTGGAGCCA TTGGAAACGT ACTCAAGTTG GCTGAAGAGG CGCCCCTGCT AAGGtGTAGG 84 0 

TCGCGAAAgG CGCGAGGGTT CGAATCCCTC CGTTTCCGTT ACTTGCTAAA ATGGTATATA 900 

CCATTTTAnC TTTTTTGTTT ACTTATATAT AATGAATGAG AATTTCACTG TTCTTTTATA 960 

TCAATTTTAA AATTCTAAAA ACCTTTCCTA GATAATCTTC TCTAAGAAAG GTTTTTATAC 102 0 

TTGTTGAACT TATAATTAAT TTATTACATA GCAATATTTA CCTGTTTTTA ACTATAAAAT 1080 

TATCACTACA TGAAATACGA TAATTCGGaT CTCTTAACTT CTCTGCaATT AATGtACTCA 1140 

TTGgTTTCAT CGTATGATTC ATGTATAATA GCATTTkTTA AATAATTC 1188 
(2) INFORMATION FOR SEQ ID NO: 508: 
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<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 84 0 base pairs 

(B) TYPE: nucleic acid 
<C) STRAND ED NESS : double 
(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 508: 

CCCAACTTCG GTTATAAGAT CCCTCAAAGA TGATGAGGTT AATAGGTTCG AGGTGGAAGC 60 

ATGGTGACAT GTGGAGCTGA CGAATACTAA TCGATCGAAG ACTTAATCAA AATAAATGTT 120 

TTGCGAACAA AAtCACTTTT ACTTACTATC TAGTTTTGAA TGTATAAATT ACATTCATAT 180 

GTCTGGTGAC TATAGCAAGG AGGTCACACC TGTTCCCATG CCGAACACAG AAGTTAAGCT 240 

CCTTAGCGTC GATGGTAGTC GAACTTACGT TCCGCTAGAG TAGAACGTTG CCAGGCATAA 300 

TATTAATCCA CAGTAGCTCA GTGGTAGAGC TATCGGCTGT TAACCGATCG GTCGTAGGTT 360 
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GGCGGTAACA CGGGTTCGAG TCCCGTAGgA GTCATACAAG CAGAAGTGAA ATATCGCTTC 480 

TGTTTTTTTA TTACATATTT ATTGTTGAGG AAGGTTGTCC GAGCTGGCCG AAGaGCACGC 540 

CTGGaAAGTG TGTAGGCGTC ACAAGCGTCT CAAGGGTTCG AATCCCTTAC CTTCCGTAAA 600 

GGcGCTTAAA TTGGTTTTAC CCATTTTAAG CGCTATTTTT ATTTTGGACT CAATCCCTTG €60 

ATATATCTGC ATTTGAGCTA TTATCCTCAT TTTTACACTT CTTATTTATT TATATCCATT 720 

TAAAATTTTT TAGCCACAAT GTGACTAATT TTTGaTGAAT AATCCTAATT TTAGtCACAA 780 

GATTTTGAAG TTTAGTCACA AAACAAATCA TTCAGATTTT TTTCyATAAA TTTAGTTTCA 840 
(2) INFORMATION FOR SEQ ID NO: 509: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1373 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
20 (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 509: 

25 TTCTATGAAA CTATCAGCTG TTTCTTTTTC CTTGGTAAAA ATCGTTTTAA CGCCATGATA 60 

CATGTATTCT CTTTCAaCAC CCGATTGGTC ATAAGCATCG AAAACACAAA TAATTTCATC 120 

TGAAATAACT GCATTATAAT TTGCAATTGC ATCTATTAAT TGCATTCTAG CTTCTTCTAA 180 

ATTCTCTTTT GCAATGGCGC TTAGCGTTGG TGATTGTCCT ATCATATTGT ATCCATCAAT 240 

GATTAAGTAA CGTTCTTTCA TTATATTTCT CCAACATCAT GTCTTTTTCG AAATACTTCG 300 

TACATCATTA AACTTGCTGC AACCGAAGCA TTCAAACTGT TTACATGTCC AACCATTGGA 360 

ATCTTAATAT AAAAATCGCA TTTATCACTT ACTAGGCGAC TCATACCCTG TCCTTCGCTA 420 

CCAATTACAA TAGCCAATGA CATGTCCGCT TCTAGATTTC TATAATCTGT TGCATTATTA 480 

GCTTCAGTGC CAGCTACCCA AAAGCCATTA TCTTTTAGTT CATCGATAGT TTTAGCTAAA 540 

TTTGTCACTC GAATAACTGG TACATGTTCA ATTGCACCTG TTGAGGCTTT TGCAACTGTT 600 

TGCGTTAGTG TAACTGAACG ACGTTTAGGA ATAATAACAC CATCAACTCC CGTTGCATCG 660 

45 GCTGTTCTTA AAATTGATCC CAAGTTATGT GGGTCTTCTA AGCCGTCTAA TATAAGTACT 720 

GTCAATAAAC CTTCTTTTTC TTTTTGCTGT TTTAAAAATT GATCGAAGTC AGCATATTCA 780 

TATGGTGCAA TAAGCGCTGC AACACCCTGA TGTGGTGCAT TTGCTAAAAA ATCTAATTTA 840 

GATTTTGGTA CAGTTTGAAC - AATGATTTTT TGATCTTTTG CATTTTTTAA AATTTCATTA 900 
ATTTGTTGCT TTTTAATACC TTCTTGAATC AATATCTTAT TTAyCGGATG CCCAGTAATA 
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TTCGTTTACT ATTGTTATTA TTTTATTTAA TAATGCCTCT AATCGTTCTT CTCTTTTTTC 1080 

TAAATAaAGA AAACCTATCA CTGCTTCTAT CkCTGAACTT TTACGATATG TTTGAACATC 1140 

5 

AGTGTTTTTA GCTTTAGTAT GACTTTTCGC GTTACGCCCT CGCTTCAAAA TATCCATTTC 1200 

TTCGTCTGTA AACCATTCTT GCTCCATTAA ATATTCTAAC GTTTGCGCCT GACTTTTGGC 1260 

AGATACATAT TTTTTAGACA TTTGATGTAG TTTATTAGGC TTACTTTTAA GCTTTAAAAC 1320 

10 % 

GATATAGGTA CGTACATATT GATCTAaGAC TGCGTCnCCC ATATATGCTA AGG 1373 
(2) INFORMATION FOR SEQ ID NO: 510: 

, 5 <i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 717 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 510: 
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TCAAGTGCCA 


ACTACACAAC 


TGATTTACAT 


TCTTTAGGTC 


AATATGTACA 


AGAAGGCCGT 


60 


CGCTTCTTAT 


TCGAAACAGT 


TGTAAAAGTA 


AATCATCCTA 


AATATGATAT 


TACTATTGAA 


120 


AAAGATAGTG 


ATGATCTAGA 


CGGATTAAAT 


TATTTAGCTG 


GTAAAACAAT 


CGACGAAgTT 


180 


AACACAAAAG 


CATTCGAAGG 


TACATTATTA 


GCGCATACTG 


ATGGTGGTGT 


TCCTAACATG 


24 0 


GTAGTGAACA 


TTCCACAATT 


AGATGAAGAA 


ACTTTCGGTT 


ACGTCGTATA 


CTTCTTCGAA 


300 


CTTGCTTGTG 


CAATGAGTGG 


ATACCAATTA 


GGCGTAAATC 


CATTTAACCA 


ACCTGGTGTA 


360 


GAAGCATATA 


AACAAAACAT 


GTTCGCATTA 


tTAGGTAAAC 


CTGGTTTTGA 


AGaCTTGAAA 


420 


AAAGrATTAG 


rAGAACGTTT 


ATAAAATACA 


TTACTTCAAA 


GATTAGTGAA 


GTTTGAAAAG 


480 


ATAGAACTAG 


ACGTTAACTA 


TTTAAAGCAT 


ATTTTCGAGG 


TTGTCATTAC 


AAATGTAAAA 


540 


ATGTAATGAC 


AACCTCGTTT 


TTATTTATAT 


GCAAGAACTA 


GGTTACTAGC 


TAaTGTGACA 


600 


AGATGTTAAG 


AGAAAATTAA 


aGATAAAATA 


ATATCTGCCT 


TACAATAATA 


TTGTTATACT 


660 


ACTAGnGACT 


GATTTATTAG 


CATGATTACA 


TGTTAATGTT 


TCTTTACTTA 


GTAATTA 


717 



(2} INFORMATION FOR SEQ ID NO: 511: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2700 base pairs 

(B) TYPE: nucleic acid 
SO (C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 
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AATCTAATTT TTCCTCCTAA TCTCGGATTG GATAGTGGTC AATTTTTCTG GCCCGCCATT 60 

TTAGCGTTTG TTCTAACTGG GATTGGTTTA CCATTATTAG GTGTGATTGT AGGTGCACTT 120 

GATAAAGAAG GATATATTGG CGCATTAAAT AAAATTTCAC CTAAATTTTC AATATTGTTC 180 

TTAATCATCA TTTATTTGAC TATAGGACCA CTTTTTGCAA TACCTAGAAC TGCATCTACA 240 

TCTTTTGAAA TGACAATTAC ACCAATTATA CATAGCAATA GTAGTATCGC TTTATTTATA 300 

10 

TTTACGATTA TCTACTTCAT AGTCGTTTTG TATATTTGTT TAAATCCATC TAAGTTAATC 360 

GATCGTATTG GTTCATTATT AACACCATTA TTATTGATTA CTATTTTAGC GATGATTATT 420 

,5 AAAGGATACT TAGACTTTAG CGGTAATAGT GCTGGAAAGG GCAATGAAGC ACTATATCAT 480 

TCTAATTTTT CAAGTTTTGC TGAAGGCTTT ACACAAGGCT ATTTAACAAT GGATGCCATT 540 

GCAGCAATTG CTTTTTCAAT GATTGTTGTT AATGCAGTAA AACTAACAGG CATTACTAAA 600 

20 ACAAATCAAA TATTCAAACA AACTTTGACT GCTGGTTTAA TTGCAGCCGT AGCTTTAATT 660 

TTCATATATA TTTCATTAGG TTATATTGGT AATCATATGC CAGTAAGTGA CATGACGTTA 720 

GATCAATTGA AATCCAAAGA TCGAAACATT GGGACATATT TATTAACGAC AATGGCTTCA 780 

25 

ACAGGATTTG GTTCATTCGG AAAATATTTA TTGGGCATCA TTGTGGCGCT GGCATGTCTA 840 

ACTACAGCAT GCGGGCTTAT TGTTGCAGTT TCTGAATATT TCCATAGAAT CGTACCTAAA 900 

GTATCATACA AAGCATTTGT ATTAGTTTTC ATTTTAATGA GTTTTATTAT TGCTAACCAA 960 

30 

GGTTTAAATG CTGTTATCTC AATGTCAATT CCGGTATTAA GGATTGTATA CCCAGTAGCA 1020 

ATAACTGTTG TATTATTAAT TTTAATTGCC AAATTCATAC CGAGAAAACG CATTTCACAA 1080 

35 CAAATTCCAG TTATTATCGT ATTTATATTG TCGATTTTCA GTGTTATTAG TAAGTTAGGT 1140 

TGGcTGAAAA TTAACTTTAT AGAATCATTG CCTCTAAGAG CGTATTCTTT AGAGTGGkTC 1200 

CCAGTAGCAA TTATTGCAAC GATATTAGGC TATCTAGTCG GCATATTTGT AAAACAAGAT 1260 

40 CCAATTAAAT ATCAACAGGA ATAACGAATA ATATAAAAGA GGTTGGGACA TAAATCCCTA 1320 

AAAAAACAGC AGTAAGATAA TTTTCAATTA GAAAATATCT TACTGCTGTT CTCTATTTAT 1380 

ACAATACTTC GTATTGAATG GCTTCGCTTT CCTAGGGTGC CGTCTCAGCC TCGGTCTTCG 1440 

45 

ACTGGCACTG GTCCCTCAGG AGTCTCGCCA TTAATACTAC GTATTAACGT GTAATTTTAC 1500 

TTTGAAATAC TTTAAAAAAA TAAGACACTT TGCCCAACTT GCACATAAAT GTAAAATTCA 1560 

ATAAAATAAA TTTTCTGTGT TGGATCCCTT CGTATAATTT AATAAATACT ACTAAACTAA 1620 

SO 

ATTAACGAGG TGCCTTATGT ATAAAAATTA TAACATGACC CAACTTACAC TACCAATAGA 1680 

AACTTCTGTT AGAATTCCTC AAAATGATAA TACGCGATAT GTTAATGAAA TTGTTGAAAC 1740 
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AAGATATGCA 


TACCGTAATG 


ATAGATATAG 


TTTTAAACGT GACTTCAAGC 


TATATGAATG 


I860 


TGATGACTGT 


TCATCATGTT 


CTTTGAGACA 


TCAATGCATG 


AAGCCAAATT 


CGAAATCCAA 


1920 


TAAGAAAATT 


ATGAAGAATT 


ATAATTGGGA 


ATACTTTAAA GyCCAAATTA 


ATCAAAAGCT 


1980 


TTCTGAACCA 


GAAACGAAAA 


AAATCTATAG 


TCAAAGAAAA ATTGATGTAG 


AGCCTGTTTT 


2040 


TGGATTTATG 


AAGGCTATTT 


TGGGTTTCAC 


TCGAATGTCA 


GTTCGAGGAA 


TAAATAAAGT 


2100 


TAAACGAGAG 


CTAGGTTTTG 


TATTAATGGC 


ACTTAATATA AGGAAAATAG 


CAGCTCAACG 


2160 


AGCTGTACAT 


TATAAAATAC 


ATATCAAAAA 


AGCTGATTTC 


TATCAAATAA 


TTAATAGAAA 


2220 


TCAGCTTTTT 


TACATTGCCT 


AAGAATTTAA 


TGTCCCAAGC 


CCTTTTTATC 


GAATAACTTA 


2280 


TTGTAAACCT 


TGTCTTTCTT 


GGTTATTGTT 


TTCGTTATTT 


1 A 1 i \J\3 A\> 1 1 


TTTGTTTCCA 


2340 


CTCTTTTTGA 


GTCATTACAT 


CGTCAACTTG 


CATGTTAACT 


TCAACTACAT 


CTAAACCAGT 


2400 


AATATATTTA 


ACTTGTTCTT 


TAACTAATTC 


AGTTACTTTA 


CGGAAGATTT 


TTGGTGCTGA 


2460 


TTCACCATAT 


TCTAAGATTA 


CTTTTAAGTC 


TACAGCAGCT 


TGTTTTTCAC 


CAACTTCAAC 


2520 


AGATACACCT 


TGAGTAACAT 


TGTTGCCACT 


TGAGAATGCA 


TTAGTGAATG 


TATCAGTTAA 


2580 


GCCACCTTTC 


ATATCTAAGA 


TACCTTTAAC 


TTCACGTGCA 


GCGATACCAG 


CAATTTTTTC 


2640 


AACAACTTCA 


TCAGAGAATG 


TTAATTTGnT 


TTTGAATTGA 


GGCTCCTGAT 


TTnGTTCnTG 


2700 


(2) INFORMATION FOR SEQ ID NO: 512: 








(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1135 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
(D> TOPOLOGY: linear 








(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 512: 






ATCAAATACA ATAATTAAAA 


TAaTGGCTAA 


TACaCCTAaA 


ATaATAATcG 


AGTTaGAGTA 


60 


GCCTAAGCGA yCACCcTAAC aGTArACATT 


CTAGGCATAT 


ATTTaTCTTT 


AGACATTGAA 


120 


GCCGCTAACA 


TCGGAAAAGC 


TGTAAATCCA 


GTGTTGGCTG 


CTAATACCAA 


AATCATCACG 


. 180 


GTCGTTGCCT 


GTACAAAATA 


GAAGGCAGCA 


TTATCACCAA 


ATATTTGCAT 


AGCTAATTGT 


240 


GATAAAACTG 


TCGTTTCCGT 


TTGTGGcAAA 


ATTCCATAAA 


CATATGCTAA 


ACCAACGATA 


300 


CCAACTAATA 


AAAACGCTAA 


AATTGAACCC 


ATAGCAATTA ACGTTTTCAC 


AGCATTTTTA 


360 


GCACTTGGCT CTCTAAAATT GGTTACCGCA 


TTTGAAATAG 


CTTCAACACC 


CGTTAACGAT 


420 


GAAGCCCCTG 


ATGAAAATGC 


TTTTAATAsC 


AAGAATAATG 


TTACTCCAGG 


AACCGCAGTT 


480 
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AATATTAATA TCACTAACCC TATAATGAAA AGATATACTG GATAGGATAA TACGGTGGCA 600 

GATTCAGTTA AACCACGTAA ATTTAATATT AAAATAAAAA GTACAAGTAw ACATGCAATC 660 

AGTrCJcTTAT GCCCATATAA ACTTGGGAAT GCAGCAACAA ATGCATCAGC ACCAGATGAT 720 

ATtnCTAACAG CGACAGTCAG TATGTAATCG ACTAATAATG AGCCTCCTGC AAGCAATCCC 780 

CATTTTTCTC CTAAATTGGT CTTGGACACC ATATACGCGC CGCCACCTTT AGGATATGCA 84 0 

TAAATAATTT GCCTATAAGA CATAATTAAA GCAGCTAATA AGATCAGAAC AGCACCTGCA 900 

ATCGGTAAAG TATACCAAGT TGCAACTGCA CCCACTACTG ATAGTGTAAT CAGTATTTGT 960 

TCGGGACCGT AAGCCACTGA AGATAATGCA TCCGACGAAA GAATCGCTAA CCCTTTAAAC 1020 

TTCGATATCT TTTCGTCTTT TAGTTCTCTG TTTTTTTTAG GTTGCCCTAT AATAAGtCTT 1080 

TTAAATTGAT kGAcATAAtC TCCTATTCCT TTTTATAGTT TTnGATGGAA ATCAC 1135 
(2) INFORMATION FOR SEQ ID NO: 513: 

( i ) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 918 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 513: 

TTATGGTAAA ACTTTAACAC AAGCATTACA TAAATCGCAA TCATTTATGT GGCAAAAACG 60 

TTGAATTTAA GCCATTTCTA TTCATTTTAC GTAATTATTA GCCGTATATG TGTAATAATA 120 

CACATTTTAT TCAGATTTTT TATCGCGCTC CATTAAATCT TTTACGCATT CTTTTACTGA 180 

GATATTTTCA AATAATACTC TATATAATGC ATTTGTAATT GGCATATCCA CATTTTTTTC 240 

TTTAGCTAAA TGATAAACTG ATTTAGTTGT ATAAATACCT TCAACAACCA TATTCATTTC 300 

AGATAATGCT TGATCCATTG ATTCACCTTG TCCAAGTTTA TATCCTAATG TGAAATTCCG 360 

AGAATGTGTT GATGTGCAAG TAACGATTAA GTCACCGATA CCACCTAAAC CTAGAAATGT 420. 

CAT AGG AT CG GCACCTAACT TTTCACCTAA TCTACTAATT TCCGCTAAGC CACGAGTCAT 480 

TAATGCAGCT TTTGCATTAT CACCGTAGCC AATTCCAGCT ACGATACCAC TTGCTACTGC 540 

GATGATATTT TTCAATGCAC CACCAAGTTC AACACCAATC AAGTCATCAT TCGTGTACAC 600 

ACGCAAATAA TCATTCATAA ATAAATCTTG CGTTAATTTA CTTACACTTT TATCTTTTGA 660 

TGAAGCAGCA ACTGTAGTTG GTTGCTTGAC TACAACTTCT TCCGCATGAC TTGGCCCTGA 720 

CAACACGCCA ATACCTGCAT TATATTCAGG TGAAATAGAA TCTTCAATCA TTTCTGACAC 780 
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CAGCTTATCA TTAATTTGAG AAGCAACTTC TCGCATTGCT TTAGTAGGTA AAGCCATTAA 
GTAAATATCT GCAAATTG 

(2) INFORMATION FOR SEQ ID NO: 514: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 587 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 514: 
CAATACTCGG TATTATAGAT AGTCCTACTA CATTTATATG GGTTTGTATC ATTACATTAA 
TTGCACATCA ACTTGAAGGT AATATCATTA CACCAAATGT AATGGGTAAA TCTTTAAGTA 
TCCATCCTTT AACAATTATC GTTGTTATTT TAGCAGCAGG AGATTTAGGT GGCTTTACAT 
TAGTTCTGAT TGCAGTGCCA TTATATGCTG TACTTAAAAC GGTTGTTAGT AATATTTTCA 
AATACCGCCA ACGCATTATT GATAAAGCAA ACAGTAATGT TAAGGACTAA TTCTGTGGAT 
GTCTTTTAAG AATATAAGAT ACTATCGCAT CAAAAGTTGA AACTACAGCT TTTGAGGCGA 
TTTTTTTGTG CATAAAAAAT CAGTCmAATG AAATATCAAA TAATTTTCCA TCAGTCCGAT 
TATTATAAAA GCAAAAAAGC TTTGCTCACA TATATAATAA CGTGAACAAA GCTGTTGAAT 
GATATTATTT AATTGCGTGG AATCCGCTAT CTACATGAAT ATTTTCACCT GTAACGCCAC 
TTGATAAATC ACTTAATAAG TAAGCCGCAG TTTTACCTAC TTCTACT 
(2) INFORMATION FOR SEQ ID NO: 515: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 812 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 515: 
GGTTCATTCC AAAAAAGTAC GCGATAATTA GCGAAGAAGA ATTTGAAAAT TTAAATGTTG 
TTAAACCAAA TAAAAATAAT GTTTTCTGGT CAGTTATAGG AAGTTCGGTT TTGTTTGGAG 
TTACTTTAAG GAAATACATA CATGTTTTTG ATGTTCAATT AGATAAGCTA GTTGTAATGA 
TATTGTGTGC TCTCGCTTTA ATTTGTGTTA TAGTTTTTTA TTTTAACTTA AATAGAAAGC 
TTAAGTTAAA AGTGTTTGAT ACAAATATTG AAAAAnATAA GAGAGTTATA TAAAwAcCAA 
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TTTCATTAAT TGCCCTTATG ACAATCGAAC CTCAAAATAT AATAATATTT ATTTATTGGA 4 20 

TTATGATGAC AATGCTTTTC TTTTTGTTAA ATATGACTTC GATAGGTAAT GAAAAAGTTC 480 

GCGTTATAAT GAAAAATAAT TGATTACATT TAAAATATTC TAAATGTTGT CGACACAATC 540 

CTTTTAAGAC GCTAGTAGAA TTTAAATGAC TTCTAATGTA TATGAAAGTG TATCAATATA 600 

AAACCAATTG AAAAGAAGTG GAGACATTGC TTTGTGAAAC TGAAAATATT AATAAGAATC 660 

CCAAATATAG AATTATCAAA TACAAAGATG AATATTTGAT GATTGATTTA GTAAGTACAT 720 

GGTTAGCACT CTTTTTCCCA ATGATTAATT GGCTGATTCC AAAAAAGTAC GTCAAAATCA 780 

GCGAAAAAGA TTTTGAAACT TTAAACATTG TG 812 
(2} INFORMATION FOR SEQ ID NO: 516: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 526 base pairs 
20 (B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



25 ■ (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 516: 

GTTCTATTAT TTCTTCCAAT GGTAATGGAT TTTCGTAAAA TGATTGATAT AAGTTGATAA 60 

TCTCAATAAC TTTTAATTGA TCTGGAAACA TCGTTTTTTG GAACATTATA CTGCGATTTT 120 

CACTTTGTAA TAACTTGTCT TTATCAAATA TCTCACCAGA ATTAGCATTA ACATTACCAA 180 

TTAATATATC AATTAACGTT GACTTTCCAG CACCATTTTT TCCAATTAAA GCGATACATT 240 

TACCTTGTTC AATATCGAAC GAAATATTTT TTAGAACACA TCTTTTATTA AATGACTTGT 300 

TGATATTAGA TATTTGAATC AATTTAATCA CCTCTATTTT TTTCTTAATT TAATATTAGT 360 

AAATTTATTA GATTTAAAAT AGAACACTTT GTCATAGATT TGAAATGACA AATGTCATTA 420 

40 TTAGATkTAC ATAATATATT TATCGTtATT TTAATTTTGG GCAAAATAAA AAGAGCCTCT 480 

ATAATCGrGc TCCTTACAAA TAaATTATAA AAttGGCGAA cTAAAT 526 
(2) INFORMATION FOR SEQ ID NO: 517: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4544 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 517: 
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GGAACACCTA AAGAAAGAAA TGATGCATTA AACACAGAGG CTGATATCTA TGTAACCAAT 120 

AAAGAAAATA CTAAATGGTT ATGCGATCAA TATAAAAAAG AATGGCCATT TGATATGGTT 180 

GTAATTGATG AACTGTCTAC ATTTAAAAGT CCTAAGAGTC AAAGGTTTAA ATCTATTAAA 240 

AAGAAATTAC CACTCATTAA TAGATTTATA GGATTAACAG GAACACCTAG CCCAAATAGT 300 

TTACAGGATT TATGGGCTCA AGTTTATTTG ATAGACAGAG GCGAAAGACT TGAGTCTTCA 360 

TTCAGTCGTT ATCGAGAAAG GTACTTTAAA CCAACACATC AAGTTAGCGA ACATGTTTTT 420 

AACTGGGAGC TAAGAGACGG ATCTGAAGAA AAGATATATG AACGAATAGA AGATATATGT 480 

TTAAGCATGA AAGCGAAAGA TTATCTAGAT ATGCCTGACA GAGTTGATAC TAAACAAACA 540 

GTAGTCTTAT CTGAAAAAGA AAGAAAAGTA TATGCAGAAT TAGAAAAAAA CTATATTTTA 600 

GAATCGGAAG AAGAAGGAAC AGTTGTAGCT CAGAATGGGG CATCATTAAG TCAAAAACTA 660 

20 CTTCAACTAT CTAACGGTGC AGTTTATACA GATGATGAAG ATGTAAGACT TATACATGAT 720 

AAGAAGTTAG ATAAGTTAGA GGAAATTATA GAGGAGTCTC AAGGCCAACC AATATTATTG 780 

TTTTATAACT TCaAACATGA TAAAGAAAGA ATACTTCaAA GGTTTAAGGa AGCAACCACA 840 

TTaGAGGATT CAAACTATAA AGAACGTTGG AATAGTGGAG ACATTAAGCT GCTTATAGCA 900 

CATCCAGCAA GTGCAGGGCA TGGATTAAAC TTACAACAAG GTGGG CACAT TATTGTTTGG 960 

TTTGGACTTA CATGGTCATT GGAATTATAC CAACAAGCAA ATGCAAGATT ATATAGACAA 1020 

GGACAAAATC ATACGACTAT TATTCATCAC ATTATGACCG ATAACACAAT AGATCAAAGA 1080 

GTATATAAAG CTTTACAAAA TAAAGAACTA ACGCAAGAAG AATTGATGAA AGCTATTAAA 1140 

GCAAGAATAG CTAAGCATAA GTAATGGAGG TATAAGATGG GAAAGGCATC ATACGATATT 1200 

AAGCCAGGTA CATTTAAATA TATTGAGTCA GAGATATATA ACCTACAAGA GAACAAGAAA 1260 

GAGATAAATA GATTGAGAAT GGAGATACTT AACCCAACGA AAGAGCTAGA CACTAACATT 1320 

40 GTGTATGGAC CGTTGCAAAA AGGTGAACCA GTTAGAACAA CTGAACTAAT GGCAACAAGG 1380 

TTATTGACTA ATAAGATGTT ACGAAACCTA GAAGAAATGG TCGAAGCAGT TGAAAGTGAA 1440 

TACTTAAAGT TACCTGAAGA TCATAAGAAA GTAATTAGGC TAAAGTATTG GAATAGAGAT 1500 

AAGAAGCTAA AG AT AG AG CA AATAGGAGAT GCATGTCACA TGCATCGTAA TACAGTTACT 1560 

ACTATACGAA AGAACTTTGT TAAAGCGGTA cGvtATCATG CAGGTATCAA ATAACATTGT 1620 

GCAAAGATTG TGCAAAAGGC CTACAAATCT GTAGTAATAT GATAGTATCG GAAAGATGTA 1680 

TAAAGTTATC TAAAAGTTAT ACGACACAAG TACACGAGGC ACATCGCTAT GCGtGTGTCT 1740 

TTTGTTATGC AATCAAAGAG GTGTAAGAGA TGACCAAGCA TAATAACATT TATAAGCATG 1800 
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AGATAGCATT AGATAGGGAT AATCATCTTT GTCAAATGTG TTTACGTGAA GACATAGTAA 1920 

CAGATGCAAA CATAGTGCAT CATATTATTT ATGTTGATGA AGATTTTAAT AAAGCTTTAG 1980 

5 ACTTAGATAA TTTGATGTCA GTTTGTTATA GCTGTCATAA CAAAATTCAT GCAAATGATA 2040 

ATGACAAAAG TAATCTTAAG AAAATTAGAG TATTAAAAAT TTAAATAAAA AAATAATTTA 2100 

TTTTTATAGC CCCCTACCCA TCGGCTTAAA ATGTTTTTTC GACGGGTACC GGCGGGGGCC 2160 

10 

CTTCGCTTGC AACGCGGATA AACTTTTATG AAAGGGGGTC TTTATATGAA ATTAACAAAA 2220 

AAACAGCTGA AAGAATATAT AGAGGATTAT AAAAAATCTG ATGACATATT AATTAATTTG 2280 

TATATAGAAA CGTATGAATT TTATTGTCGG TTAAGAGATG AACTTAAAAA TAGTGATTTG 2340 

15 

ATGATAGAGC ATACAAACAA GGCTGGTGCG AGCAATATTG TTAAGAATCC ATTAAGCATA 2400 

GAACTGACAA AAACAGTTCA AACACTAAAT AACTTACTCA AGTCTATGGG TTTAACTGCA 2460 

20 GCACAAAGAA AAaAGATAGT TCAAGAAGAA GGTGGATTCG GTGACTATTA AAGTTTTAAA 2520 

TGAACCTTCA CCAAAACTAT TAACAACATG GTATGCAGAG CAAGTCACTC AAGGGAAAAT 2580 

AAAAACAAGC AAATATGTTA AAAAAGAATG TGAGAGACAC CTTAGATATC TAGAAAATGG 2640 

25 AGGTAAATGG GTATTTGATG AAGAATTAGC GCACCGTCCT ATTCGATTCA TAGAAAAGTT 2700 

TTGTAAACCT TCCAAAGGAT CTAAACGTCA ACTTGTATTA CAACCATGGC AACATTTTAT 2760 

TATTGGCAGT TTGTTTGGTT GGGTTCATAA AGAAACAAAA CTGCGCAGGT TTAmAGAAGC 2820 

30 

TTTGATATTT ATGGGGCGAA AAAATGGTAA AACAACTACT ATATCTGGTG TTGCTAACTA 2880 

TGCTGTTTCT CAAGATGGAG AAAACGGCGC TGAAATCCAT CTTTTAGCAA ACGTAATGAA 2940 

ACAAGCTAGG ATTCTATTTG ATGAATCTAA GGCGATGATT AAAGCTAGCC CAAAGCTTAG 3000 

35 

AGAAAATTTT AGACCTTTGA GAGATGAAAT TCATTACGAT GCAACTATAT CTAAAATTAT 3060 

GCCACAGGCT TCAGACAGTG ATAAGTTGGA TGGTTTAAAT ACACATATGG GCATTTTTGA 3120 

40 TGAAATTCAT GAATTTAAAG ATTATAAATT GATTTCAGTT ATAAAAAACT CAAGAGCGGC 3180 

AAGGTTACAA CCCCTTCTTA TCTACATTAC GACAGCAGGG TACCAACTAG ATGGACCACT 324 0 

TGTTAATATG GTAGAAGCGG GAAGAGACAC CTTAGATCGA ATCATCGAAG ATGAAAGAAC 3300 

45 TTTTTACTAT TTAGCTTCTC TCGATGATGA CGATGATATA AATGATTCGT CGAATTGGAT 3360 

TAAAGCAAAT CCTAACCTAG GTGTTTCTAT CGATTTAGCT GAAATGAAAG AAGAGTGGGA 3420 

AAAGGCTAAG AGAACACCAG ATGAACGTGG AGATTTTATA ACCAAAAGGT TTAACATCTT 34 80 

50 

TGCTAATAAT GATGAGATGA GTTTTATTGA TTATCCAACA CTTCAAAAAA ATAATGACAT 3540 

TATTTCCTTA GATGAGTTGG AAGGTAGACC ATGTACTATA GGTTATGATT TATCAGAAAC 3600 
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AACACATTCT TGGATTCCTA AGCATAAAGT TGAATATTCT AACGAAAAGA TACCCTATAT 3720 

AGAATGGGAA GAAGACGGAT TACTAACAAT ACAAGATAAT CCTTATATAG ACTACCAAGA 3780 

TGTTTTAAAT TGGATAATAA AGATGAATGA GCATTATGTT GTCGAAAAAA TCACTTATGA 3840 

TAGGGCGAAT GCTTTTAAAT TAAATCAAGA GTTAAAGAAT TATGGCTTTG AAACAGAAGA 3900 

AAcwAGACAA GGGGCTTTGA CCTTGAGCCC TGCaTTGAAG GATCTAAAAG AAATGTTTTT 3960 

AGATGGGAAA ATAATATTTA ATAATAATCC TTTAATGAAA TGGTATATCA ATAATGTTCA 4020 

GCTGAAACTA GACAGAAATG GGAACTGGCT GCCATCTAAA CAAAGCAGAT ATCGTAAAAT 4080 

AGATGGTTTT GCAGCATTTT TAAACACATA TACAGATATT ATGAATAAAG TTGTTTCTGA 4140 

CAAGGGTGAA GGAAACATAG mATTTATTAG TATTArAGAT ATAATGCGTT AAGGAGGTGA 4200 

ATGTTATCGC AAAAGAGAAT ATTGTCACAC GCATAAAGAA AAAATTGATA GACAATTGGA 4260 

20 TTGaTCAGTC AGCTTCTAAG CTTTATGACT TTAGCCCATG GAAAAATAAA TCTTTTTGGG 4320 

GTGTAATCAA TAATACGCTT GAAACTAATG AAACGATATT TTCAGCTATT ACnAAGTTAT 4380 

CTAATTCGAT GGCTAGTTTG CCCTTGAAAA TGTATGAAGA TTATAAAGTA GTTAATACAG 4440 

AAGTATCTGA TTnACTTACA GTGTCACCGA ATAATTCTCT GAGCAGTTTT GATTTTATTA 4500 

ATCAAATTGA AACAATCAGA AATGAAAAAG GTAATGCATA TGTG 4544 
(2) INFORMATION FOR SEQ ID NO: 518: 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 881 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 518: 

40 CATGGCAGAA TATTGAAGCT GTAAAAAAAG GACATGTAAT TTCATATAAA GCAGAAGATT 60 

ATTGGTTCAC AGATCCTATT ACATTAGAAC ATTTGAGAAG TAAATTAAAA AAAGAAATTT 120 

TAAATAAAAA ATAATAGAAA TAAGTTGTAA AAATTTTCTT ATGCATTGGT ACTAATGTTT 180 

45 TTAAGGAGTG ATTAAATGAA GCAACTGGTT GGAATTCCCG AATCAATGTT AATTCCTTTG 240 

ATAGCTCGAG CAAAAGAGTA CGAAAACGAA AAACCAATAA TAAAAGACGC ACTATCAAAA 300 

AAAATATTTG ATGGTTTAGA TGATATGTAC AAAAATGTTA CATGTGATGA CATGTCTCAA 360 

50 

ATTGGAATTA GTATACGTAC TGTGATAATA GATTGTGTTA CTAAGAGGCT TATCAAGGAT 420 

AATAAAGATT TAATCGTGGT CAATATAGGT TGTGGCTTAG ATACAAGGTT TCAAAGATTT 480 
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10 



ACATTTTTTA AAGAAAGTAA TAGTTATAAG ATGATATCTA AATCTATGCT AGATTACAGT 600 

TGGATTGATG ATGTCAAAAA TTATAAATTT TTTAATAGTA AGTCAGATAT ATTGTTTATT 660 

ATTGAAGGTG TATTGaTGTA TTTTGATGAG AGTGTAATGA CTCAATTATT GGACACTATT 720 

ATCAAAAAGA TGGGAGATCA TAATTTGACA TTTGCGATTg AATTTTGCTC aAAAACAATT 780 

GCGAATAATA CmAAGAGACA TCAATCGGTA TCCAAGTTAT CCTCACCACC TGTTTTTAAA 840 

TATGGGTACC ATGATTTAnA AAAATTGGAT GAnATTTACC C 881 
(2) INFORMATION FOR SEQ ID NO: 519: 

1S (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3122 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY : linear 

20 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 519: 

TGAATaaAAA TATATTAATA GATAAACACA AATGTGTCcA AATACCCCTA GAGGTATTTG 60 

ACnAGTTCCA TCCAACTGTT TAAAATACCC CTACAGGTAT TTTTAGGGAG GTTATTATGA 120 

AACAATACGG AGAAAaGTTT ATCGATGAAT TTAGTAAAGC AGAATTGGAA AAACTAGCCA 180 

AGCAAGGGCA ATTAATTGAC GTTAGAACAG AAGAGGAGTA TGCATTAGGA CATATCAATG 240 

GTTCCATACT TCATCCTGTT GATGAGATTG AGTCATTCAA TAAAGAAAAA AATAAAACCT 300 

ATTATGTAAT CTGTAGAAGT GGTAACAGAA GTGCTAATGC TAGTAAATAT TTAGCTAAAC 360 

AAGGTTATAA CGTTATAAAT CTTGATGGTG GTTATAAAGC TTATGAAGAA GAAAACGATA 420 

GTTATGATAC ACAAGAAGAA TATAAAAGTA TAGAAATTAA AGCAGATCGT AAACAATTTA 480 

ACTATCGTGG TCTTCAATGT CCAGGGCCAA TTGTAAAAAT TAGTCAAGAA ATGAAGAATA 540 

40 TTGAAGTAGG TGACCAAATT GAAGTCAAAG TCACAGACCC TGGATTCCCT AGTGACATTA 600 

AAAGTTGGGT GAAACAAACA AGGCATACTT TAGTTAAGCT TGATGAAAAT AACAATGGAA 660 

TTAATGCGAT TATTCAAAAA GAAAAAGCAA AAG ATTT AG A TATAAATTAT TCTGCTAAAG 720 

GTACTACAAT TGTATTATTT AGTGGAGAAT TAGACAAAGC TGTAGCAGCG TTGATTATTG 780 

CAAATGGTGC TAGAGCTGCT GGAAAAGATG TAACTATCTT CTTTACTTTT TGGGGGCTTA 840 

ATGCATTAAA AAAAGTGCAA ACAGTTAATG TTAAAAAGCA AGGTATTGCA AAAATGTTTG 900 

ATTTAATGTT GCCCAAAAAG AATATACGAA TGCCTCTTTC CAAAATGAAT ATGTTTGGTT 960 

TAGGAAATAT GATGATGCGC TACGTAATGA AAAAGAAAAA TGTTGATTCA TTACCAACAC 1020 
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TCATGGGTAT TCAGAAAGAA GAACTTAGAG ATGAAGTTGA GTACGGTGGT GTAGGCACTT 1140 

ATATTGGTGC TACTGAAAAT GCGAATCATA ATTTATTTAT CTAATTAAAT CTATTAATAA 1200 

5 

AAGGAGTTGT TATCATGTTT TTTAAACAGT TTTACGATAA TCATTTATCT CAAGCATCAT 1260 

ATTTAGTGGG TTGTCAACGT ACAGGAGAGG CAATAATAAT AGACCCTGTT CGTGATTTAT 1320 

CGAAATATAT AGAAGTTGCA GATTCTGAAG GTTTAACAAT TACACAAGCT ACAGAAACAC 1380 

10 

ATATTCATGC TGATTTTGCT TCAGGAATTC GTGATGTGGC TAAACGCTTA AATGCAAATA 1440 

TATATGTGTC TGGCGAAGGT GAAGATGCAT TAGGGTATAA AAATATGCCA TCAAAAACAC 1500 

, 5 AATTTGTTAA ACATGGAGAT ATCATTCAAG TAGGCAATGT TAAATTAGAA GTTCTGCATA 1560 

CTCCAGGACA CACGCCTGAA AGTATTAGCT TTTTACTCAC TGATTTAGGT GGTGGTTCAA 162 0 

GTGTTCCGAT GGGATTATTT AGTGGTGACT TTATTTTTGT TGGTGATATA GGTAGACCTG 1680 

20 ATTTAtTAGA AAAATCTGTT CaAATAAAgG GTTCTACAGA AATTAGCGCG AAACAAATGT 1740 

ATGAGTCCGT TCAAAATATT AAAAATTTAC CAGACTATGT TCAAATCTGG CCGGGTCATG 1800 

GTGCTGGAAG CCCTTGTGGT AAAGCATTAG GTGCCATACC TATATCTACA ATAGGTTATG 1860 

25 AGAAAATTAA TAACTGGGCA TTTAATGAAA TTGATGAGAC TAAATTTATT GAATCATTAA 1920 

CATCAAATCA ACCAGCACCA CCGCATCATT TTGCACAAAT GAAACAAGTT AATCAGTTTG 1980 

GTATGAATTT ATATCAATCA TATGATGTTT ATCCTAGTTT AGATAATAAG AGAGTAGCAT 2040 

30 

TTGATCTTCG TAGCAAAGAG GCCTTTCACG GTGGCCACAC AAAAGGAACA ATCAATATAC 2100 

CATACAACAA AAACTTTATT AATCAAATTG GTTGGTACTT AGATTTTGAA AAAGATATAG 2160 

^ ATGTAATTGG AGATAAATCT ACTGTTGAGA AAGCGAAACA CACTTTAGAA TTAATTGGGT 2220 

TTGATAAGGT AGCAGGCTAT CGTTTGCCAA AATCAGGCAT TTCAACCCAG TCCGTTCATA 2280 

GCGCTGATAT GACAGGTAAA GAAGAACATG TATTAGACGT ACGTAATGAT GAAGAGTGGA 2340 

40 AT AATGGACA CTTAGATCAA GCAGTTAATA TTCCGCATGG TAAATTATTA AATGAAAATA 2400 

TTCCTTTTAA TAAAGAGGAT AAAATATATG TACATTGTCA GTCAGGTGTT AGAAGTTCAA 2460 

TTGCAGTGGG TATATTGGAA AGCAAAGGTT TTGAAAATGT GGTGAATATT AGAGAAGGCT 2520 

45 ATCAAGATTT TCCAGAATCA TTAAAATAAT TTAAGGATGT GGAAAAAATG AATAAGCAtT 2580 

ATCAAATTGT TATTATTGGT GGCGGTACAG CAGGTGTTAC CGTAGCATCA AGACTATTAA 2640 

GAAAAAATCA AAACTTAAAA GAGAAAATAG CAATTATAGA TCCAGCAGAC CATCATTACT 2700 

SO 

ATCAACCATT ATGGACGTTG GTTGGTGCAG GGGTATCTAG TTTGAAAAGT TCTCGTAAAG 2760 

ATATGGAAAG TGTTATACCT GAAGGTGCTA ACTGGATAAA ACAGGCTGTT TCAAGTTTTC 2820 
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TAGTAGCTCC AGGATTACAG ATTAATTGGT CTTCAATTAA AGGACTAAAA GAAAATATAG 



2940 



GTAAAAATGG TGTTTGCTCT AACTATTCAC CTGACTATGT TAACgAAACT TGGAACCAAA 



3000 



TTTCTAATTT TAAACAAGGA AATGCCATTT TTACGCATCC AAACACTCCT ATAAAGTGTG 



3060 



GAGGTGCgCC TATGAAAATT ATGTATTTAG CTGAAGATTA TTTTAGGAAA CATAAAATCC 



3120 



GT 



3i22 



10 - 



15 



20 



25 



30 



35 



40 



45 



50 



(2 J INFORMATION FOR SEQ ID NO: 520: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3 982 base pairs 
<B) TYPE: nucleic acid 
(C) STRAND EDNESS : double 
<D) TOPOLOGY : linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 520; 

ATAnAGATAT AnATnAATAT ATTGAGGTCA AACGATGATA ATTAAAATTT TAACAATTCT 60 

ATTACTACTT TGTATATTGA GCTATTTGGT TACAAATAGA AAGAAGCCTT TTCTGTTCTT 120 

AAAGACACTC TTTATGGGTG TGGTATTTAT CTTTATAGGA TATATTTCAC TGGCAATATC 180 

TGCCGTAATT ATTTATGGTA TTATTCAATT TATCACAATT GATTTTGGTA GTTTTTTCTT 240 

AATGGGTATT ATATTGATCT TGATTTCAAG TATATTCCAA TTATTTATAG TTAGATTACT 300 

TTTTAGAAAA AAGAATGTCG ATTTGACAGA GGTTGTCGTT TTAsAsCATT TAATTCAATG 360 

GTTCTTAGTT TACTTTGCGA TCTATCAAGC AGTAAATGAA AAAATGGACA TTAATGATAT 420 

TAATATCGAC AATTTCCAAT CTGTCTTTTT TGACGTGTCT AATTTGAATT TAGTAATTCT 480 

ACCAACGTTA ATCATTAGCT GGGTCACAAT ATTTAACTAT AGAATGAGAA GTTACAAATA 540 

AAATCTATGA GATTATACCT TCAGACACCA ACATTCAAAT GGTGTCTTTT TTGTTGTGTG 600 

GTTTTATTTT TGAAATTCGA AAAAGTAGAG GCATGAATTT TTTGACTAGT GTATAAGTGC 660 

TGATGAGTCA CAAGATAGAT AGCTATATTT TGTCTATATT ATAAAGTGTT TATAGTTAAT 720 

TAATAATTAG TTAATTTCAA AAGTTGTATA AATAGGATAA CTTAATAAAT GTAAGATAAT 780 

AATTTGGAGG ATAATTAACA TGAAAAATAA ATTGATAGCA AAATCTTTAT TAACATTAGC 84 0 

GGCAATAGGT ATTACTACAA CTACAATTGC GTCAACAGCA GATGCGAGCG AAGGATACGG 900 

TCCAAGAGAA AAGAAACCAG TGAGTATTAA TCACAATATC GTAGAGTACA ATGATGGTAC 960 

TTTTAAATAT CAATCTAGAC CAAAATTTAA CTCAACACCT AAATATATTA AATTCAAACA 1020 

TGACTATAAT ATTTTAGAAT TTAACGATGG TACATTCGAA TATGGTGCAC GTCCACAATT 1080 
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TCAAAATCTT GTGAGAGAAT TTGAAAAAAC ACATACTGTC AGTGCACACA GAAAAGCACA 1200 

AAAGGCAGTC AACTTAGTTT CGTTTGAATA CAAAGTGAAG AAAATGGTCT TACAAGAGCG 1260 

AATTGATAAT GTATTAAAAC AAGGATTAGT TAAATAAAAC TTCAATCGTT GCTGTTATCT 1320 

GGAAATAATT AATTAAATGT TATGTTAATT TTTGTTAATG AAAAAAGTAA TCTATTTAAT 1380 

GACAGGTTAA TGTAATTGTC CTGAAATTGA CTATATACTC AGTAAGTATC AATTTTAAGG 1440 

AGAGCTTATA ATGAAATTTA AAAAATATAT ATTAACAGGa ACATTAGCAT TACTTTTATC 1500 

ATCAACTGGG ATAGCAACTA TAGAAGGGAA TAAAGCAGAT GCAAGTAGTC TGGACAAATA 1560 

TTTAACTGAa aGTCAGTTTC ATGATAAACG CATAGCAGAA GAATTAAGAA CTTTACTTAA 1620 

CAAATCGAAT GTATATGCAT TAGCTGCAGG AAGCTTAAAT CCATATTATA AACGTACGAT 1680 

TATGATGAAT GAATATAGAG CTAAAGCGGC ACTTAAGAAA AATGATTTCG TATCAATGGC 1740 

TGATGCTAAA GTTGCATTAG AAAAAATATA CAAAGAAATT GATGAAATTA TAAATAGATA 1800 

ATAAATAAAA CAGGTTGAGA CAAAAAATGG TCTTAACCTG TTTTCAATTT GCATATGTGA 1860 

TAAATTCTAT ATCAAAATGC TTATGTATAA TGAATGACAT TTAAAAGTAG GGGAGACAAA 1920 

25 TATAAATACA ATAGTTCCTA GGATTACTCT CAAAATAACT ATATCAATTA TTTACTTTGC 1980 

TCTCCTATTT TTTAAAATAT GTACATGTTT AAACAATCAA AAGTGTACAA TATTAAATTA 2040 

TCATTTCCAG TTCTAGTGCT ATATTGGTAG TAGTTGACTA AATGAAAATA AGCTTATAAC 2100 

AAGTTTTTTC AATACTCGTG GGGCCACAAC AGAGAGAAAT AGGATCACCA ATTCCAACAG 2160 

ACAATGCAAG TTGGCGGGGC CCCAACATAG AGAAATTGGA TCACCAATTT CAACAGACAA 2220 

TGCAAGTTGG GGTGGGGCCC AACACAGAAG CTGGCGAAAA GTCAGCATAC AAAAATGTGC 2280 

AAGTTGGCGG GGCCACAACA GAGAGAAATA GGATCACCAA TTCCAACAAA CAATGCAAGT 2340 

TGGCGGGGGC CCCAACATAG AAGCTGGCGA AAAGTCAGCT TACAAAAATG TGCAAGTTGG 2400 

CGGGGCCCCA ACATAGAGAA ATTGGAACCC CAATTTCTAC AGACAATGCA AGTTGGGGTA 2460 

GGACATCGAT AAAGAAATAC TTTTTCTTTA GCAATTAGTA TTTCTTATGC ATGAGCTTTA 2520 

CTCATGTATT CATTTTTTAA GTACaCATTA GCTACAGCTA ATGATAAAGA ACCACTACAT 2580 

45 AATAAATCAT TAGTGGTTCT TTATCATTTC TATCTCACTC TTTTACTGGA AGAAAAAGTT 2640 

TACGTTTGTA GAACATGCCA CAATACCAAA AATAATTAAG AAAAATAAGA CGATAAGCAT 2700 

GATGACACTT TTCAAACAAC CTCTATCAGT TTCTTTCGAT TTTCTTTGTT GAACCTTTTT 2760 

50 ATAATCTTCA AGTAGTTTTG CGGCTTTTTT ATTTATATGT TTATTCATGA TGTTGACTCC 2 820 

TTATAATATA TGTTTAATTC ATTAAAATAG TTGAAAACAT GACTTGAAAT AAAGATATAA 2880 
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AATTTGATGA TGATATTTGC TTTTTATTTT CCAAATGGAA TTTACTTAAA CTGATGCATT 3000 
AAAATATTAA TGAAGCACTA GAATACATAA ATGAATAGTa ATGGTGcACA GTATAGAATA 3060 
5 ATTAAGGCTA TATTAAGTAT AAATATCGTT AACTGTAAGC TATCTTTAGT TTTAATATAA 3120 

ACTATTAGGA TAATCGACGT AAGAAGAATC ATATATATTA ATGATGAAGA AGTCCATACA 3180 
AAATCCGCAT CATTTGTTGT TAATAATGGG ACTATAATTA ATCCGAAATT AATCATGCAT 3240 

10 

GCTATATATA CTATAATGTT ATACACAATG TTAATTTTTG TTCACCACCT TATACTTCTA 3300 
TTTTAAAAAC TTCTTTATAA TGATATATTG TTTAATGTTG AAATAATTAG ATTATCTAAT 3360 
TTTCATTTGC TTTACATGTA AAAGGCTATA TATAGTATGC TCTTTATGAT TCTAAATGCT 3420 

15 

TTTTAATATT TAATGCTCAT CAACATTTGG ATTTTGAATA TTCAATTCAA AAACTTTATT 34 80 

AGCTACGTCA ATTGTAAAAT CAGAACCATA GTTGACATGA GCTACTTTTA ATTTTCCATC 3540 
TAAATAATAG ATTGCGATTG CAACATCGTA AAATTCGTCA ATGACAAATA AACTCTTTTC 3600 

20 

GTTTGTTACA ACCTCATGCT CTCCTGAGTA TACAACGTTA ATTTCCCAAT CATTAAAAAC 3660 
CATTTGTTAA CCTCGTTGAA CATTTAAATT GATTCAACTT AAGTTTAACT TATTCATACA 3720 

25 ACTTCGTACA ATATCTAGAT GAACATTAAT TGTATTTCTA GAAATCTTTT TCAATTATAT 3780 

GTACTAATTA TACTTTTAAA TTTCTTATTT CAGTATAGTt TTAAAACGAT TTTAAAATAA 3840 
TTCTGCAAAT ATATTAACAC ATAATGTGTT CAAAAAGTTT TGAACAATTT CAAAACTTTT 3900 

30 ATATAAAGGG nTTGACAACA TGGATTCAAA TnTCTTATTT TAAAAATTAC CTCATATAGT 3960 

GTCATGTTAG CCAATTTTTA AG 3982 
(2) INFORMATION FOR SEQ ID NO; 521: 

35 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1353 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

40 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 521: 
AGCTTGGaTG ATTTAATaTG GtCCtTTCCC AaCcTTAGAT AATGAAAGAT tTGATAATCC 60 

45 

TGAATATAAA GAAGCTATGA AAAAATATcA ACAGAGATTT ATGGCTGmAG ATGAGGCTTT 120 
GAAGAAATTT TTTAGTGAAG AGAAAAAAAT aAAAAATGGA AATACTGATA ATTTAGATTA 180 
SO TCTAGGATTA TCTCATGAAA GATATGAAAG TGTATTTAAT ACTTTGAAAA AACAAAGTGA 240 

GGAGTTCTTA AAAGAAATTG AAGATATAAA AAAAGATAAC CCTGAATTGA AAGACTTTAA 300 
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GTTAGGTAAA ACATTTTATC AAAACTATAG AGATGATGTT GAAAGTTTAT ATAGTAAGTT 420 

AGATTTAATT ATGGGATATA AAGATGAAGA AAGAGCAAAT AAAAAAGCAG TTAACAAAAG 4 80 

5 GATGTTAGAA AATAAAAAAG AAGACTTAGA AACCATAATT GATGAATTTT TTAGTGATAT 540 

AGATAAAACA AGACCTAATA ATATTCCTGT TTTAGAAGAT GAAAAACAAG AAGAGAAAAA 600 

TCATAAAAAT ATGGCTCAAT TAAAATCTGA CACTGAAGCA GCAAAAAGTG ATGAATCAAA 660 

70 

AAGAAGCAAG AGAAGTAAAA GAAGTTTAAA TACTCAAAAT CACAAACCTG CATCTCAAGA 720 

AGTTTCTGAA CAACAAAAAG CTGAATATGA TAAAAGAGGA GAAGAAAGAA AAGCGAGATT 780 

TTTGGATAAT CAAAAAATTA AGAAAACACC TGTAGTGTCA TTAGAATATG ATTTTGAGCA 840 

15 

TAAACAACGT ATTGACAACG AAAACGACAA GAAACTTGTG GTTTCTGCAC CAACAAAGAA 900 

ACCAACATCA CCGACTACAT ATACTGAAAC AACGACACAG GTACCAATGC CTACAGTTGA 960 

20 GCGTCAAACT CAGCAACAAA TTATTTATAA TGCACCAAAA CAATTGGCTG GATTAAATGG .1020 

TGAAAGTCAT GATTTCACAA CAACGCATCA ATCACCAACA ACTTCAAATC ACACGCATAA 1080 

TAATGTTGTT GAATTTGAAG AAACGTCTGC TTTACCTGGT AGAAAATCAG GATCACTGGT 1140 

25 TGGTATAAGT CAAATTGATT CTTCTCATCT AACTGAACGT GAGAAGCGTG TAATTAAGCG 1200 

TGAACACGTT AGAGAAGCTC AAAAGTTAGT TGATAATTAT AAAGATACAC ATAGTTATAA 1260 

AGACCGAATA AATGCACAAC AAAAAGTAAA TACTTTAAGT GAAGGTCATC AAAAACGTTT 1320 

30 TAATAAACAA ATCAATAAAG TATATAATGG GCA 1353 

(2) INFORMATION FOR SEQ ID NO: 522: 

(i) SEQUENCE CHARACTERISTICS: 
3S (A) LENGTH: 1987 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

40 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 522: 



GTCTGAGTCA GGTGCTGTTT GGTTAGATGC TGAAAAAACA AGTCCTTATG AATTTTATCA 60 

45 ATTCTGGATT AATCAATCAG ACGAAGATGT AATTAAATTC TTnAAATACT TTACTTTCTT 120 

AGGAAAAGAA GAAATTGATC GCTTAGAACA ATCTAAAAAT GAAGCACCGC ATTTACGTGA 180 

AGCTCAAAAA ACATTAGCTG AAGAAGTAAC TAAATTTATT CATGGTGAAG ATGCATTAAA 240 

SO TGATGCAATC CGTATTTCAC AAGCATTATT TAGTGGTGAT TTAAAATCAT TATCAGCGAA 300 

AGAATTAAAA- GATGGATTTA AAGATGTGCC TCAAGTGACA TTATCAAATG ACACAACAAA 360 
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TGTTAACAAT GGTGCGATTT 


ATATTAATGG 


TGAGAGACAA 


CAAGATGTTA 


ATTATGCTTT 


480 




AGCACCAGAA GATAAAATTG 


ATGGCGAATT 


TACGATTATT 


CGTCGCGGTA 


AGAAAAAATA 


540 


5 


CTTCATGGTT AACTATCAAT 


AAATATAATT 


GCATAGCTAA ATAAATTAGA 


GCCTACTCAT 


600 




ATTCATTCCT AAGAATGTAA 


TGAGTAGGCT 


CTTAATGTAC 


TTTTCTGTCT 


GTAAATTATC 


660 




7AAAGAAATC 


TCTATCGCCT 


TGGCCAGGTG 


ATTGACGTTC 


TGATCGGCTT 


TGACGTTTTG 


720 


10 


GTTGTTCTTT 


TTGTTGTTTT 


AATTTCACTT 


TAACTTCTTT 


TGTTTTACCA 


TCACGGATAA 


780 




CGGTAACAGT 


GACTGATTCA 


CCAGGTTTTT 


TATTTTCATA 


TAAATAGCTT 


CTTAAATCAA 


840 


15 


CATCATCTTT 


AATTTTCTTG 


CCATCAATTT 


CTGTAATAAT 


ATCACCTTTT 


TTAAGATCAA 


900 


TATCACTATC 


AGCTTTGGCG 


ACATAAATAC 


CGTCTTCTCT 


ATCAGTATGA 


AGTTGCTCGC 


960 




GCTCTTCTTC 


AGGAATATCT 


TTCAAATTAA 


TTAAACCAAT 


ACCAATCGAA 


GGGCGGTCAA 


1020 


20 


TTTTACCATG 


TTTTACAAGT 


TGTTCAATTG 


TTACTTTAAC 


TTCATTACTT 


GGAATAGCAA 


1080 




ACCCGATACC 


TTCAACTTGT 


GTCGCAGCAA 


TTTTCATTGA 


GTTAATACCA 


ACTAAATTAC 


1140 




CATTAATATC 


TACTAATGCG 


CCACCTGAGT 


TACCTGGGTT 


AATAGCAGCA 


TCTGTTTGAA 


1200 


25 


GAACGCTAAC 


TTTTGTATTG 


CCACCAGTTG 


TCTCAGCGTC 


AATCGTACGT 


TCGCTTGCTG 


1260 




AAATGATACC 


AGATGTTACA 


GAGTTAGCAA 


ATTGTAATCC 


TAATGGGTTA 


CCCATTGCGA 


1320 




ATACGCTATC 


GCCAGTTTGT 


ACTTTTGAAG 


AGTTGGCAAA 


TTGAATCGCT 


TTAATACCTT 


1360 


30 


TTGTATTTTC 


AATTTTAAGT 


ACAGCAATAT 


CAGTTACTGc 


ATCTTTACCA 


ACTAATTTCG 


1440 




CTTTAACTTG 


TTTTTTATTA 


TGTAATTGGa 


CTCTAATTTC 


ATTTGCGCCA 


TCAATAACAT 


1500 




GATTGTTTGT 


AACGATATAA 


GCTGAATTGT 


TGTTTATTTG 


aTAGATAACA 


CCTGAACCTA 


1560 


35 


CTCCAGCTTC 


AGATGGTTTA 


GATGATTTGC 


CyTTTAATAA GTCGTCTACA CTTGATGCTT 


1620 




TTtGCATGTk 


AATAACTCCA 


ACAATTGTAG 


GGGAGACAGA 


TTTTATCATT 


TCATGAAGGG 


1680 


40 


TACCGAATTT 


CTTGCTTTGA 


CCGTCTAATT 


GATTGCCACC 


TTTATTATTT 


GTTGTCTGAA 


1740 


CAGTTGAACC 


ATCTTTATTT 


AAAATTGTAC 


TATTTAATAC 


TTTGCCTATA 


GCAAGTACTA 


1800 




GAAGTGCACC 


AATAATTCCA 


GCAATCAATG 


CAACGATGAC 


TGTnTTAAAC 


CATGGAAATT 


1860 


45 


TAGGTCTTCT 


GTATCTAGGT 


GTTTGGCTAT 


GGTTTGTTGT 


AGAATGATCT 


GTATGATTAA 


1920 




AATCTGACAT 


ACTTAACCTC 


CATTATATGA 


TTTATATATG 


CTTTAATTAT 


GTCTTTTnTT 


1980 




TATAATT 












1987 


50 


(2) INFORMATION FOR SEQ ID NO: 523: 









(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 13 51 base pairs 
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(C> STRANDEDNESS : double 
(D) TOPOLOGY: linear 

£ 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 523: 





TTAGAAGTCA AATCATTAnT 


GGCGTCnTAT 


CGAGTATACT 


ATTAACTTPA 


APT ATTTTAfi • 
x f \ x x x x i\j 




10 


CAATTGCATA TATTTTAATG 


TGGTTTAACG 


GCCATATGAC 


aCTAACTTTf! 
a x nn w xxx \j 


A P PTT A APrJ A 
A xxwM*un 


X « u 




CAATAATTAC AAGCTGTTTA 


AC CTT ATT AA 


TATGTAGTAT 


TTTT ATT A AT 
xx Hnl Inni 


CC APTTATAP 


i a a 

JLoU 




AAAAAATTAA GCAGTTTAAT 


ATAAAAACTA 


AGCJUVTTTGP 


TA AP^TtA A AT 


TAPPP& Bfipj 


240 




ATGATAAAAC GTTTAATTCA 


CCAAAAGAAA 


TTT & TP. A & TT 


AnAlUnnlLl 


•PTTS »T*A A & ft 


3 00 




TGGCTTCTGA AATTACGCAA 


CAAATGAATP 


A A ATT & A ATP 




UAAAAAACAG 


360 




AACTGATTCA AAACTTAGCC 


CATGATTTAA 


#in/iUil.l. ill 




ATTTCATATT 


420 


20 


CTGAAGGACT ACGTGATGGT 


ATAATCACTA 


AfV^ATPATriA 






4 80 




TATTAATTAA ACAAGCAAAC 


AGATT AT CAA 


PATTATTTY2 A 


"TYIATATYSAPT 


PAT7ATT7ATPR 

LA1A1 lAlcA 


540 




CTTTAAATAC AGGTAAAACA 


TATCCCCCAG 


AATTAATACA 


APTAC5APPAA 


TT A PTTflT & T 




25 


CAATATTGCA ACCATATGAG 


CAACGTATCA 


AACATGAAAA 


PPP.PAPATTA 


P, A AflTP. A ATT 






TCTGTAACGA AATTGATGCA 


TTTTATCAAT 


ATCGAACGCC 


ACTTGAGCGT 


ATTTTAAPAA 
f\ x x X X /UlUnn 


Ton 
/ ^ u 


30 


ACTTACTTGA TAATGCGCTA 


AAATTTTCAA 


ATGTTGGTAG 


TCGCATTGAT 


ATTAATATTA 


760 


GTGAAAACGA AGATCAAGAT 


ACTATCGACA 


TTGCTATTAG 


CGATGAAGGT 


ATTGGCATTA 


840 




TACCAGAACT ACAAGAACGT 


ATATTCGAAC 


GTACATTCAG 


AGTAGAAAAC 


TCTCGTAATA 


900 


3$ 


CAAAAACGGG TGGTTCTGGA 


TTAGGCTTAT 


ATATAGCTAA 


TGAACTCGCG 


CAACAAAATA 


960 




ACGCAAAAAT CAGTGTAAGC 


AGTG AT ATAG 


ATGTAGGAAC 


TACGATGACT 


GTAACATTAC 


1020 




ACAAATTAGA CATTACGTCA 


TAATCCGATT 


TATTTATAAA 


ATAAAATGCA 


AAGACTAAAA 


1080 


40 


AGAAGCTCCC ATTAATGAGG 


GCTTCTTTTT 


TTGTTTATTT 


AGAATAAACT 


TTATGGGTAT 


1140 




CCTTCTCATC ATTTTCAAGA CTTGAAAGAT 


TTGTAGCTTG AATAATATAT 


TTAGGACGTG 


1200 




CCTTAACTTC ATAATATATC 


CTGCCAATAT 


ATTCACCTAC 


AACACCAATT 


GAAATTAACT 


1260 


45 


GTATGCCGCC TAATAATAAA 


ATAGCTGCAA 


TCGTTGAAAA ATATCCCGGA ATATTAA,CAC 


1320 




CAGATATCAT AATATTGATG 


GAATAAATAG 


A 






1351 




(2) INFORMATION FOR SEQ ID NO: 524: 









(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 433 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NQ: 524: 

5 TTGTTGTCAG TTTAACGCAA CGTGTTACCG ACTTTTCAAG TACACAAcAA TATATATGTC 60 

TATTCCATTT TTAGCCCcTG CCATTTTCAT CATTGGTGGT ATTATGTTGT TTATTTCAAC 120 

ATTTAATAGC TTAGATGAAA CTGCTGAAAA TAATAACAAA ATAAAGAAAC TAATGATTAA 180 

70 AGGACTTATC ATTATTAACA TTTCATTTAT CGTTATGATG GTTTTAACAC CATATTGGTA 240 

CTTGTATTTA ATCGTCTATC TTATTTTCTT GTTGTTTTTA TTGTGGCAAA AGGTTTATAA 300 

ATTTTAATAC CAAAACTATT AAACACTTCT GATATTCTTA GTTCAAAATA TCAGAAGTGT 360 

15 TTTATAGTGT TATCTAGTTC AGATAAATAT TTCCTTACTT AAAAAAACGC CCTCCTCTTA 420 

TTTTGACCCC nAT 433 
(2) INFORMATION FOR SEQ ID NO: 525: 

20 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1845 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 

25 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 525: 



30 


CCCCCACTAT 


GATATGCTTG 


GCCTATTGCG 


TCAATCCCCT 


TATATTTCGG CAATAGAGAT 


60 


. GGATGTATAT 


TCAATATTTT 


ACCTTCAAAT 


GAAGCTAATA 


AGTCTGGACC AATTAGACGC 


120 




ATGTAGCCAG 


CTAGAATAAT 


CCACTCTACC 


TTATCTTCAT 


TTAATAATGT TACTAAATGT 


180 


35 


TGTTCATACG 


CTGCTTTTGA 


ATCAAATTGT 


TTTGGTTCAT 


TAATATAAAC AGGAATATCG 


240 




TGCTmTTG 


CTCTATCTAT 


ACAAAACGCA 


TTTTGATGAT 


CCGTATATAG CGCCGTAACT 


300 




TCAATATTTT 


CAAGTTTTCC 


TGATTCAACA 


TGCTCAACTA 


TATTTkCAAA GTTACTTCCT 


360 


40 


GAACCTGATG 


CAAAAATCGC 


AATTTTAACC 


ATTGTTATAC 


CCCCAACAAT TCAATTGCAG 


420 




TTGACTCATT 


TTTCACAATA 


TGACCAATTT 


GATAGGCTTC 


CACATTTTGT TCTGCTAAAA 


480 




TCTTCAAAGC 


GCGTGATACA 


TCTTTTTCAT 


CAACGATAAC 


CGTATAGCCA ATACCCATAT 


540 


45 


TAAAAATGTT 


ATACATTTCA 


TTTGTGTCTA 


TATTGCCTTG 


TTGTTGTAAC CAATCAAATA 


600 




TTTTTGGTGT 


TGGAAATGAT 


GTAGTATCAA 


TTCTAGCAGC 


ATATCCGGCT GGCAATGCAC 


660 




GTGGAATATT 


TTCATAAAAA 


CCTCCACCAG 


TAATATGATT 


CATTGCCTTA ATAGAAACTT 


720 


50 


cttttttcaa 


AGCAAGTACA 


GGTTTGACAT 


ATAATTTAGT 


TGGTTCTAAA AAGACATCGA 


780 
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£ 



10 



15 



20 



GCACTAAACT 


GTATCCATTT 


GAATGAATGC 


CACTTGACGC 


AAGCCCTATA 


ACAACTTGTC 


900 


CCTCTTTCAC 


TTCTGAACCA 


TCTACATAGT 


CATCCTTTTC AACTGCTCCA 


ACAGCAAATC 


960 


CAGCTACATC 


ATATTCGCCT 


TCGTGATACA 


TTTCACCCAT 


TTCAGCAGTC 


TCTCCACCGA 


1020 


TAAGTGCAGT 


ATTCGTTTCA 


ACACATGCAT 


CACTAATACC 


TTTAACAATT 


TGTTCAATAA 


1080 


CTTCAGGAAC 


AACTTTGTTT 


GTAGCAATGT 


AATCTAAAAA 


ATATAATGGT 


TCTGCACCTG 


1140 


TCGTTAAAAT 


ATCATTAACA 


CACATTGCGA 


CTGCATCGAT ACCTATCGAA TCATGTTTAC 


1200 


CATAGTCGAT 


AGCTAGTTTT 


AATTTCGTAC 


CTACTCCGTC TGTTCCAGAA ACTAAAACTG 


1260 


GCGCTGtCAT 


ATTTAATTGT 


GATAAATCAA 


ATGTAGCACC 


GAATCCACCT 


AAACCACCGA 


1320 


TAACTTCTTT 


ACGCATCGTA 


CGtTTAACaw 


GaCtAGaCaT 


TCtTTCtACA 


GCTTCATAAC 


1380 


CAGCATGAAT 


ATTTACACCA 


GATTGTTCAT 


ATGCTTTAGA 


CATTTAAATT 


TCCCTCGCTA 


1440 


TCAAAAAAGT 


GTTTGTTTTT 


AGAAATATAT 


TGCTTTTGTC 


GATGACTTAA 


ATGCGCTTTA 


1500 


TAATTTGCTT 


CATAATCATA 


TAACCCTGCA 


GGATAATCTC 


CAGTGAAACT 


TTCTACACAT 


1560 


AAGCCACTAT 


ATGGCGCGTC 


ATAATCTAAA 


CCAATTGATT 


CAATTAACCC 


ATCTACAGAT 


1620 


AGATATGCTA 


ATGAATCAGC 


GCCAATATAA 


TCTTTAATTT 


CTTCAGGTGA 


TTTGCTTGCA 


1680 


GAAATTAATT 


CTGCCGTAGT 


TGAAACATCG 


ATTCCGTAAA 


AACTTGGAAA 


CATAAATTCC 


1740 


GGTGATGCTA 


TACGCACATG 


CACTTkATTT 


GCACCAGAAT 


CkTTTAACAT 


TTTCACAATG 


1800 


CGTCGAATTG 


TCGTACCGCG 


nACAATGGAA 


TCATCAACAA 


GACTG 




1845 



(2) INFORMATION FOR SEQ ID NO: 526: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1141 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

40 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 526: 
TCATAAATnG TAAATGTTAA TCGTCATATA ATATTAATTT ACAACACCAT TTTGGTTATT 60 
TGAAGCTTGT GGCGCTTGTT GTGTGCCACC TTGATTTTGA TTTGAGTTTT GATCTGTAGC 120 

45 

AGGTTGTTGT TGATTGCTGG AmtCACTGTT ATTAGTTGAm TCACTGTTCT CGTTAGATGT 180 
CTTATCTTTA TCTGTCGTAT CATTTTGTTC TTTTCTCAAT AAACTATTAT CTAAAGGCGT 240 
50 TAATGGTATT AATGAACCAT AATGATTAAT GACACGTTGA TCTAAGAAAT CATTTTTATC 300 

ATTAATAGGT GATAATTCTA AGTCTTTACG AAGTAAGTTT GCATATTTTT GAATGCTTTC 360 
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AGTTTTAATT TCAACATCAT TTGTTaAGTA CATTTTTGCT AAAGCTTTAA TTTCAGAGTT 480 

AGTTAAATTA TGCTTTGCAT TTTTACCTAC AATTTGAATC ACGTTATCAA GTTTATCAAT 540 

5 

AGAATCAACT TCCTGTGCTT TTTGGAATAA AATCTTAATT AATTCCATTT GACGTTGTCC 600 

ACGTTTTAAG TCTGAATCAT GATGTCTAGT TCTAGCAACT GCTAAAGCCT CATCACCATT 660 

TAATTTTTGG TACCCTTTTT TAATTTTAAT CTTACCAGTA TCATCTGTGT TAGGTTCATT 720 

10 

TAAGTCGTAT GGCACATCAT AGTATATGCC ACCAAGCTCA TTTACAGCCT CGACAAATGC 780 

TTTCATATTG ACTCTCACAT AATAATCAAC AGGTACATTC ATGGTAGCTT CTACCGAATC 840 

/5 CATTGCGGCA ATTGGACCAC CATATGCATG TGCATGGGTA ATCTTATCGT AATAGCCAAC . 900 

TTTAGGAATG TAGCTGATAG TATCACGTGG AATACTAAGC ATTCTAATTT GATGTTTTGA 960 

TTGATTAAAA GTAGTTAAAA TCATAGCGTC TGATCTAGAG TGTTCAGCAT CCTGTCCTTT 1020 

20 r rrTCTTCTT CCATCGTTAT CATCGATACC TAAGAAAAGA ATAGAGATAG GTTGTTCTTC 1080 

GGGATGACTT TATTATCTCT TAAGTTGGAT TGACGTTAGC ATTTTTGCTG TCTTGAGAAG 114 0 

A 1141 

25 (2) INFORMATION FOR SEQ ID NO: 527: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1565 base pairs 

(B) TYPE: nucleic acid 
30 (C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

3$ <xi) SEQUENCE DESCRIPTION: SEQ ID NO: 527: 

GCACCATTAG CATTGGGCnC ACTGATTGGA GTAnCAGTTG TTGAAAATTC GGCGCCAACA 60 

AGTAAACmGG CmCaGGCaGC mATamCCCCa TATTATAcTT ATAATGGTTA TATTGGTAAT 120 

40 . AATGCTAATT TTATTCTGGA TAAGAATTTT ATTAACGCGA TTAAGTATGA TAATGTGAAA 180 

TTCAATGGTA TTAAATTAGC TAAAACGAAT ACGATAAAAA AAGTAGAGAA ATATGATCAA 240 

ACTTTTAAAG GTGTTTCTGC AAAAGGAAAC GAAGCAAGTC AATTGCAATT TGTAGTTAAA 300 

45 AATAATATTT CATTAAAAGA TATCCAAAAA GCTTATGGCA AGGACTTGAA AAAAGAAAAT 360 

GGTAAAACAA AGGAAGCTGA TAGCGGTATT TTTTACTATC AAAATGCTAA AAAGACATTA 420 

GGCATCTGGT TTGTCGTTGA TCATAATAGA GTTGTCGAAG TAACAGTTGG ACATACACCA 480 

SO 

TACAAAACAA GTAAATAAAA TAATGGCATA TTAAGGCTAG AGTGTGAGGA GTGATACCGC 54 0 

ATTCTAGTCT TTTTTATTAA ATAATAACGA TTATTGCGTC TTACATAGTT GTTTGAAATT 600 
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GATTAAGTAT ATAGAGCACT ATTTTGTATT TGTTAATATT TTCACAAAAA TAAAGCCTTG 720 

ATAAATTTTA AAATATAATT AAGCTCAATT TTTAAAATTT TATTTAGCTA CAGATAACAT 780 

5 TTTTAAAAAA GAAAAGAATC AATAAATAAA ATCAACGAAC AAAAAGTATA GAAATAAATA 840 

GAAATAATCA TTTACTTTTC TGAAAAATTA AATTAATATT TTATTTATAA GCTGTTTTTA 900 

AGATTTCAGG AGGAATGAAA TGTGaGGAAA TTTTCAAGAT ATGCATTTAC AAGTATGGCA 960 

10 

GCATTAACCT TGTTGAGCAC TTTATCACCA GCAGCATTAG CGATTGATTC AAAAAATAAA , 1020 

CCAGCTAATT CTGATATTAA ATTTGAGGTG ACTCAAAAGA GTGATGCGGT CAAAGCATTA 1080 

15 AAAGAATTGC CTAAATCCGA AAATGTAAAA AATATTTATC AAGATTACGC TGTTACTGAT 1140 

GTAAAAACTG ATAAAAAAGG ATTTACGCAT TATACATTGC AACCGAGTGT TGATGGTGTT 1200 

CATGCACCTG aCAAAGAAGT GAAAGTACAC GCAGACAAAT CAGGAAAAGT CGTTTTAATC 1260 

20 AATGGGGATA CTGATGCGAA GAAAGTAAAQ CCAACGAATA AAGTGACATT AAGTAAAGAT 1320 

GACGCAGCCG ACAAAGCATT TAAAGCAGTT AAGATTGATA AGAATAAAGC GAAAAATCTT 1380 

aAAGATAAAG TCATTAAAGA rAACAAAGTT GAAATCGATG GTGACAGTAA TAAATACGTT 1440 

25 TATAATGTTG AGTTAATTAC AGTGACACCA GAAATTTCAC ATTGGAAAGT TAAAATTGAT 1500 

c 

GCTCAAACTG G CG AAATTTT AGAAAAAATG AACTTAGTTA AAGAAGCTGC AGAAACTGGT 1560 
AAAGG 1565 

30 

(2) INFORMATION FOR SEQ ID NO: 528: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 2870 base pairs 

(B) TYPE: nucleic acid 
35 (C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



40 (xi) SEQUENCE DESCRIPTION*. SEQ ID NO: 528: 

GGATAGGTAA ATCCATTCAA AATTGGTTGT ACTCATTTTA AATCATATTT TTTAATATAG 60 

AAACACATAA TTAAAGGAGT GATGATATTA ATGAATAAAC TTCGAGACAC TACTTTTCTA 120 

45 TCATATTTAT TTACTATCAT ATTGTGGGGA TCTGCATTTC CAATGATAAA GATTGCGTTA 180 

AATGATTTTA GTGCAGAATC ATTGTCGGCA TTTCGTTTAA TTTTAGCAAC AATAATTCTC 240 

TTGCCGTTCG TAATTATAAA GAAATTGCCT ACCCCTGAAC TAAGAGATAT CCCTGTTATT 300 

SO 

TTTATTTTAG GATTTTGTGG ATTTGTGATA TATCACACAG CTTTAAATTT TGGTGAAaCT 360 

TTGATTAGTG CAGGTATAtC TGGrATTCyA GTCTCTACAA CGCCTATTTT TTCTAGTGCT 420 
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10 



15 



20 



25 



30 



35 



40 



50 



GCATTTATAG GAATATCCAT TATTTCAATA AGTAAAGATG ATTACACAAC TATTAATGTA 
TTAGGTGTTT TTATTATTTT ACTTGCATCT TTTAGTGAAA GTTTGTATTT TACTTTCCAG 
AAAAAATACA TAGAAAAATA CGGCTTCATC GCTTTCACAC TATaTACAAT AATGGCAAGC 
TCACCATTTA TGCTTATTTT TATTCCTGAA ATCATCAACG ATATACACGG CGCCACTTTT 
ACATCAATAG TATCGGTACT TTATTTAGCT ATATTGCCTA CTATAATTCC ATACGTTTTG 
CTTGCTTATA TTGTGAAGTC AGTTGGTGTC TCTGATGCAA CAATGTCTCT TTATTTAACA 
CCTATCGTTT CTTTATTATT ATCTTATCTG TTATTAGACG AGCTACCAAC AACCCTTGCT 
ATTATAGGCG GAATTATCAC TCTACTAGGC GTTAGTTTAA GTAACTTCTT TCAAAATACA 
TAATTATTCC AAGTCCCGGA CCTCAGAATC CAAAAACATT CGAGTGATAA AATTTTAAAA 
ATCAAAAATA TAAAAATGAT CTAATTTCGT CAAATTTACC AATATAAATA CTAATATTTG 
CAATTCACAA AGGGGTATAG TCTGAGTGTA TTCTAATACG AAAGGACTTG GTGGATATGT 
ATTACAGTTA TGGAAATTAT GAAGCATTTG CGCGCCCTAA AAAACCTGAA AATGTAGAAA 
ACAAATCCGC TTACTTAATC GGATCTGGTC TAGCTTCACT TGCTGCAGCT TGTTTTTTAA 
TAAGGGATGG TCAAATGGAA GGTTCGAAGA TTCATATTTT AGAAGAGTTA CCTAAAGCAG 
GTGGTAGTCT TGATGGTGAA AATATGCCTT TAAAAGGCTA TGTTGTCCGC GGTGGTCGTG 
AAATGGAGAA CCACTTTGAA TGTTTGTGGG ACTTATTCAG ATCTATCCCT TCATTAGAAA 
TCGATAACGC GTCTGTATTA GATGAGTTCT ATTGGCTAAA CAAAGAAGAC CCTAACTATT 
CTCGCTGTCG TGTTATTGAG AAACAGGGTC AACGTTTAGT CACAGACGGA GACTTCACTT 
TGACTAAAAC GGCGATTAAA GAAATTTTAG ATTTATGCTT AACGAATGAA GAAGATTTAG 
ATGATGTCAA AATAAGAGAT GTATTTTCCG ATGACTTCTT TAATTCAAAC TTTTGGATTT 
ACTGGAAAAC GATGTTTGCA TTTGAACCGT GGCATTCTGC AATGGAAATG CGTCGCTATC 
TAATGCGATT CGTTCATCAT ATTAGTGGTC TCGCAGACTT TTCAGCTTTA AAATTCACTA 
AATATAATCA ATATGAATCT TTAGTATTAC CTATGGTTGA ATATTTAAAA TCGCATGGGG 
TTCAATTTGA ATACGATGTA AAAGTCGAAG ATATTAAAAT AGATGTTACG ACAAGTCAAA 
AAATTGCCCG AGAAATATTA ATTGACCGTA ATGGTAATGC AGAATCTATT AAACTGACTA 
TAAACGATCT TGTCTTTGTG ACAAACGGTA GTATTACAGA AAGCTCTACT TATGGTGATA 
ATGATACACC AGCGCCACCA ACTGACGAAT TAGGTGGTAG TTGGACACTA TGGAAAAATT 
TAGCGCGACA AAGTCCTGAA TTTGGTAATC CTGATAAGTT TTGCCAAAAT ATTCCTAAAA 
AAAGTTGGTT TGTTTCAGCA ACTTCTAGAA CAAACAATAA AGAGATTATC GATACAATAG 



S40 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
2220 
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TCAATGATTC TGCATGGCAA ATGAGTTTTA CAATCAATCG TCAGCAACAG TTTAAAGACC 2340 

AACCTGAAAA TGAAATATCT ACATGGATTT ATGCCTTATA TTCAGATGTA AACGGCGATT 2400 

5 ATATTAAAAA GCCAATTACA GAATGTAGTG GTAATGAAAT ATGCCAAGAA TGGCTGTATC 2460 

ACTTAGGTGT ATCAACTGAC AAAATTGAAG ACTTAGCAAA ACATGCATCT AATACGATTC 2520 

CTGTTTATAT GCCATATATC ACATCTTATT TCATGACGCG TGCTATCGGC GACAGACCTT 2580 

10 

TAGTCGTCCC GCATCAATCT CAGAACTTAG CATTTATTGG TAACTTTGCA GAAACAGAGC 2640 

GAGACACTGT ATTTACAACA GAATATTCGG TTCGTACTGC CATGGAAGCT GTTTATCAAT 2700 

TACTAAATAT AGATCGTGGT ATTCCAGAAG TCATCAATAG TCCATTTGAT CTTCGCGTCT 2760 

15 

TAATGGATGC CATATACGAA CTGAATGACC ACCAAGATTT GCGTGAGATT ACTAAAGATT 2820 

CGAAAATGCA AAAACTCGCA TTAGCAGGAT TCCTTAAAAA GATAAAAGGT 2870 
20 (2) INFORMATION FOR SEQ ID NO: 529: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3105 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
25 <D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 529: 

30 

CnGTTTAGCT GCAAAAAGTA AATAACGACA CTGTATTTGG AATTTTGCAA TTAGAAACAC 60 

TTTTGGGTGA CATTAACTCA ATTTTCAGCG AGATTGAAAG CGAATACAAA ATGTCTAGAG 120 

AAGAAATTTT AATTTTACTA ACTTTATGGC AAAAAGGTTC TATGACGCTT AAAGAAATGG 180 

35 

ACAGATTTGT TGAAGTTAAA CCGTATAAGC GTACGAGAAC GTATAATAAT TTAGTTGAAT 240 

TAGAATGGAT TTACAAAGAG CGTCCTGTTG ACGATGAAAG AACAGTTATT ATTCATTTCA 300 

40 ATGAAAAGTT ACAACAAGAG AAAGTAGAGT TGTTGAATTT CATCAGTGAT GCGATTGCAA 360 

GTAGAGCAAC AGCAATGCAA AATAGTTTAA ACGCAATTAT TGCTGTGTAA GTTTAATAGC 420 

ATAAAAAGAG GTTTTCATTA AGTTGAAAAC CTCTTTTTGT TGTTGGCATT AATTTTTCAA 480 

45 ATGTTGACTA CTCAATCCTA AATTATAAAT AGTATAGCGC aCAAaTGCTT AAGAAATTTT 540 

TTCTATGGCA CAAATGAATG GAGCATGATT ACGTTGGTTT AAAAATTGAT ATTGCAAAAC 600 

TTGCGCATGC TTTTGATCCA AAGTACTCAA GTAATCAAGC AATGCATGCT TCTCAATTTG 660 

SO 

TCCTTCGCTA TGACCATGAT ATATAACAAG TACAATAATA CCTTCAATTG ACATTAATGA 720 

TAGCAATGAA TTAATAGCTT GGATTGTCGT GTCAGGCTTT GTCACGATAG ATTTATCACC 780 
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TATATGATGT 


TCAATATTTT 


CATGTCCATC 


TTTTATTAAA 


GAAACATGAT 


TGAAATCCTT 


900 


AACTTTATCA 


CGTGTATTTT 


CCAAAGCTAA 


ATCTTGAATG 


TCGAAACCAT 


AAACATGTCC 


960 


TTCTGGTACT 


TGTTCGGCTA AAAATAAAGT 


GTCATTGCCG 


TTACCGCAAG 


TTGCGTCTAC 


1020 


AACAATACTT 


TCTGGTGTTA 


TATGTTGTTT 


AATAAGTGTT 


TTTGAAAAAG 


GGAGTATACG 


1080 


TTCTAATTTC 


ATTGCTTCAC 


CTTAGACTTG 


TAACGCAAGC 


CTTGATAAGA ATTTCTACGT 


1140 


GCTAATTCAG 


CATCGATGCC 


ATTTAATACT 


TCCCATTTAT 


TAACACTCCA 


CATTGGACCT 


1200 


ACCATGATAT 


CTATTGGACC 


ATCACCGGTA 


ATTCGGTGAA 


GGATCATTTC 


AGGGGGAATC 


1260 


ACTTCTAATT 


GGTCCACAAC 


TAGGTTTGTG 


TACTCTTCTT 


GAGTCATAAA 


AGTTAATAAA 


1320 


CCTTTATCGT 


ATTGTTTTAC 


CATCGGTGTA 


CCTTTTAACA 


AATGAAGTAA 


ATGAATTTTA 


1380 


ATACCTTGTA 


CATCCATTTG 


TGCAcTTCTT 


TGGCAGTAGC 


CATCATCATG 


TCATAGTCTT 


1440 


CGCCAGGTAA 


GCCATTAATG 


ATGTGTGTAC 


ATACATTGAT 


ATTATGCTTA 


CGTAATTTTG 


1500 


CCACACCATC 


ATAATAAGTT 


TTCATATCAT 


GGGCACGATT 


GATTAAATCA GATGTTGACT 


1560 


GATGGATTGT 


TTGTAGTCCT 


AATTCAACCC 


ATAAGTATGT 


TCGTTGATTC 


AAATCTGCTA 


1620 


AATATTCGAC 


AACATCGTCT 


GGTAGACAGT 


CAGGACGCGT 


ACCAATAGAT AATCCCACAA 


1680 


CACCCGGTTC 


TTTAAGTACA 


GGTTCGAATT 


TTTCTTTTAA 


TACTTCAACC 


GGTGCATGTG 


1740 


TATTTGTAAA 


TGCCTGAAAA 


TAAGCAATAT 


ATTTTCCTTC 


GTGCCATTTC 


TCATGCATCT 


1800 


TTTCTTTAAT 


TTCTTTAAAT 


TGTAGTGCGA 


TTGAATCTGC 


ACGATTACCT 


GCAAAGTCTC 


1860 


CGCTACCTGC 


AGCAGAACAA 


AATGTACATC 


CACCATGTGC 


TACAGTGCCA 


TCGCGGTTAG 


1920 


GACAGTCAAA 




AA 1 (jV—AAL. 1 1 


TAAATATTTT 


TTGTCCAAAT 


TTArrrrrTA 


1980 


AATGGTAATT 




1 AAl<V7 111 o l 


TTTCAAAAGC 


GTATTGGAAA 


TGATTGCCCA 


2040 


TATGTCATTT 


I LCI I 1C1A1 




TTCTAAGTAC 


AGATTTTAAC 


ATATTTTAAT 


2100 


GTTATAGTGT 


TTATTATAGT 


TTGACAAAAA 


AGAGAGAGGA 


ACTATGAAAT 


ATGAATATAC 


2160 


CTAAATCAGT 


CTGGTGGCTA 


GTAATTGGCA 


TGGCGTTAAA 


TATTACTGGT 


TCCAGTTTTT 


2220 


TGTGGCCTTT 


AAATACAATT 


TATATGAAAC 


AAGAACTTGG 


AAAAAGTTTA 


ACTGTTGCTG 


2280 


GTTTAGTGCT 


AATGATAAAT 


TCATTTGGCA 


TGGTTATTGG 


AAACTTATTA 


GGTGGTTCAC 


2340 


TATTTGATAA 


ATTAGGTGGA 


TACAAGACGA 


TTTTAATTGG 


AACTTTCACT 


TGTCTTTGTA 


2400 


GTACAACGCT 


ACTTAATTTC 


TTTCACGGGT 


GGCCTTGGTA 


TGCTGTATGG 


CTTGTAATGT 


2460 


TAGGGTTTGG 


TGGCGGAATG 


ATTATTCCTG 


GGATATACGC 


TATGGCTGGA 


GCAGTGTGGC 


2520 


CAAATGGCGG 


AAGACAAACG 


TTTAATGCGA 


TATACTTAGC 


GCAAAATATT 


GGTGTGGCTG 


2580 
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ATCTTATTAT GTATGTTGTG TTTGCGCTTG TCGCGGTAAC GCAATTTAAT ATTGAAATTA 2700 

ATGCGAAAGT TAAATATCCA ACTCATTTAG ATATTACTGG TAAAAAGAAT AAAGCAAGAT 2760 

TTATTTCATT AGTACTAATT TGTGCAATGT TTGCAATTTG TTGGGTTGCA TATATTCAAT 2820 

GGGAGTCTAC AATCGCTTCA TTTACACAAT CTATTAATAT TTCAATGGCA CAATATAGTG 2880 

TTTTATGGAC AATTAACGGA ATAATGATTT TAGTAGCACA ACCATTAATT AAACCGATTC 2940 

TCTATCTGTT AAAAGGAAAC TTAAAGAAGC AAATGTTTGT CGGCATCATC ATTTTTATGT 3000 

TGTCGTTCTT TGTCACGAGT TTTGCCGAAA ACTTTACAAT ATTTGyTGTC GGTATGATTA 3060 

TTTTAACTTT TGGAGaATGT TTGTATGGCC AGCAGTTCCA ACTAT 3105 
(2) INFORMATION FOR SEQ ID NO: 530: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 5532 base pairs 
20 (b) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



25 (Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 530: 

TAATGATTAA ACCAGATGCA GTACAAAGAA ATCTAATTGG TGAAGTAATT TCAAGAATTG 60 

AAAGAAAAGG ACTAAAACTT GTCGGTGGTA AATTAATGCA AGTACCAATG GAACTTGCTG 120 

AAACACATTA TGGTGAACAC CAAGGTAAAC CATTTTATAA TGATTTAATT TCATTTATTA 180 

CATCAGCACC AGTGTTCGCA ATGGTAGTTG AAGGTGAAGA TGCAGTTAAT GTATCTAGAC 240 

ATATTATTGG CAGCACCAAT CCTTCAGAAG CTTCACCAGG ATCAATTAGA GGTGATTTAG 300 

GTTTAACTGT TGGTAGAAAT ATCATTCACG GTTCAGATTC ATTAGAGTCT GCTGAACGTG 360 

AAATTAATCT ATGGTTTAAT GAAAATGAAA TTACTAGCTA TGCTTCACCA CGTGATGCAT 420 

40 GGTTATATGA ATAAAATATA AACTGTAAAC CTTTACGATT TATTTATAAA GGTAGAAAGG 480 

GTTTTGTTAT GTGGTTAGTC ATTATGaTTA TACATAACAA GGCCC G TTTT TTATGTTGTA 54 0 

GTAAATTACT TGAAAAATTT TATAGTTTTT kGGTAAcACG. TAtTaAAAaG AGAGGAATAT 600 

45 TCTTTATCAA ATGAAACTAA ACAGAGAGAA GGGGTTGTTA AAATGAAgAA TATTATTTCG 660 

ATTATTTkGG GGATTTTAAT GTTCTTAAAA TTAATGGAAT TACTATATGG TGCTATATTT 720 

TTAGATAAAC CACTTAATCC TATAACAAAA ATTATTTTTA TACTGACTCT CATTTATATT 780 

TTTTATGTAT TAGTAAAAGA ATTGATTATA TTTTTGaAGT CAAAGTATAA CAAAAGCGCT 84 0 

TAACATATGT ATATTTTAAT ATCATAATTT TTTTAAACGG ACTGATTAAC TTTATTAATA 900 
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GATACGATTA TATTAAAACG GCTAATCATT 
TAGAAATTCA TGATACTTTT CTACAGACGA 
5 TATTAAGATA ATTCTGACAT TTAAAATGAG 
AACAAACATT TATGAATGCA CAATGAATAT 
CGTGGAAGTA TGAAAGGAGC GAGTGTGTAT 

10 

ACCTCAATTA ACAGTTATTG TTGAAGGTGT 
TATTAATAAA GAAATGTTTA AGCGTCAAGG 
TGAGAAAGAT ACAGTAGAAA TAGTATCAGG 
AATTACTATG GTTGTAACCA ATGATGACTT 
TCCAATAAGT GAAGAAGAAC GTGAAAATAT 

20 TCATGCAGAT TTGGTTGGAG GTATGAAATA 
GCGATCATCT GCTAGAGAAA CAGCAGCTCG 
ATTACAACAG TTAGATATCG ATATATACAG 

25 TAAAGATTTT TATGATTCAG AAACATTTAA 
AATTGATGAC AGTATCGCAC AAGCAATGCG 
AGATTCAATT GGCGGTGTCG TTCAAGTTGT 

30 

TTATGTGCAT TATGATCGTA AGTTAGATGG 
TGCTTTTAAA GGTGTAAGCT TTGGTGAAGG 
GATTCAAGAT GAAATTCTAT ATAATAGTGA 

35 

AGGTGGTTTA GAAGGCGGTA TGTCAAATGG 
ACCAATTCCA ACGTTATATA AACCATTAAA 

40 TAAAGCAACA ATTGAACGTT CTGATAGTTG 
ACATGTCGTA GCATTTGAAA TAGCAAAAGC 
TGAGCAACTT AAACAACAAA TTATTGAGCG 

45 AGAACAATTG AGGTGTAATC ATGAAATTAC 
TATATGTTGA ACACGGTGCA ATTGACCATA 
GTTTTATATT AATTGACGAG CATGTAAATC 

SO 

TATCATATGA AAATGTACAT AAAGTTATTA 
AG CAATATCA AGAAACATTA GAGTATATTT 

55 



TTTAATTAAT GATTATATGA TGCAACTGTT 1020 

ATATATTATA ATTAATTTTA GTTCGTTTAA 1080 

ATGTCATCCA TTTTCTTAAT TGAGCTTGAA 1140 

GATAAGATTA ACAACATATT ATAATGTTAT 1200 

GAGATACCTA ACATCAGGAG AATCACATGG 1260 

ACCTGCAAAT ATAGAAATTA AGGTTGAGGA 1320 

CGGTTACGGA CGTGGACGTC GTATGCAAAT 1380 

CGTTAGAAAT GGTTATACAT TAGGTAGTCC 1440 

TACGCATTGG AGAAAAATTA TGGGAGCAGC 1500 

GAAACGTACT ATTACAAAAC CAAGACCTGG 1560 

TAATCATCGT GATTTACGAA ATGTGCTAGA 1620 

AGTTGCAGTC GGTGCGTTAT GTAAAGTGTT 1680 

TCGTGTTGTT GAAATAGGTG GAATTAAAGA 174 0 

AGCAAATCTT GATCGTAATG ATGTTCGTGT 1800 

AGATAAAATT GACGAaGCTA AAAATGAAGG 18 60 

AGTTGAAAAT ATGCCTGTTG GTGTAGGTAG 1920 

TAAGATTGCA CAAGGTGTTG TCAGCATAAA 1980 

ATTTAAAGCA GCTGAAAAGC CAGGTAGTGA 2040 

AATTGGTTAT TATCGTGGAT CTAATCACTT 2100 

AATGCCAATT ATCGTTAATG GTGTAATGAA 2160 

TTCAGTAGAC ATTAATACTA AAGAAGACTT 2220 

TGCTGTTCGT GCAGCAAGTA TCGTCTGCGA 2280 

ATTATTGGAA GAATTCCAAT CAAATCATAT 234 0 

CAGACAATTA AATATTGAGT TTTAACAACA 2400 

AAACAACATA CCCTTCAAAT AATTATCCAA 24 60 

TTAGCACGTA TATTGATCAG TTTGATCAAA 2520 

AATATTTTGC TGATAAATTT GATGATATTT 2580 

TTCCAGCTGG TGAAAAGACG AAAACATTTG 2640 

TATCCCATCA TGTAACTGGT AATACAGCAA 2700 
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ACGAGGCGTG CACTTTATAC AAGTGCCAAC GACTATACTA GCGCATGATT CTAGTGTTGG 2820 

CGGTAAAGTG GGTATTAACT CAAAGCAAGG TAAAAACCTT ATCGGTGCAT TTTATCGTCC 2880 

AACTGCTGTG ATTTATGATT TAGTCTTTTT AAAGACGTTA CCATTTGAGC AAATATTAAG 2940 

TGGCTATGCA GAAGTTTATA AGCATGCGTT ATTGAATGGT GAATCAGCGA CGCAAGATAT 3000 

CGAACAGCAC TTTAAAGATA GAGAGATATT ACAGTCATTA AATGGTATGG ATAAATATAT 3060 

TGCTAAAGGT ATTGAAACGA AGCTGGATAT TGTTATTGCA GATGAAAAAG AACAAGGTGT 3120 

ACGTAAATTT TTAAATTTAG GTCATACATT TGGTCATGCT GTTGAATACT ATCATAAAAT 3180 

ACCTCATGGT CATGCAGTGA TGGTTGGCAT TATCTATCAA TTTATAGTTG CGAATGCTTT 3240 

GTTTGATTCT AAGCATGATA TTAATCATTA TATTCAATAT TTAATACAAC TCGGCTATCC 3300 

TTTAGACATG ATAACTGACT TGGATTTTGA AACGTTATAC CAATATATGC TAAGTGATAA 3360 

20 AAAGAATGAT AAGCAAGGTG TACAAATGGT CTTGATTAGA CAATTTGGAG ATATCGTTGT 3420 

ACAACATGTT GATCAACTAA CATTACAACA TGCATGTGAA CAATTAAAAA CATATTTTAA 3480 

GTAGGTGAAT GAAATGGTAA ATGAACAAAT CATTGATATT TCAGGTCCGT TAAAGGGCGA 3540 

25 AATAGAAGTG CCGGGCGATA AGTCAATGAC ACACCGTGCA ATCATGTTGG CGTCGCTAGC 3600 

TGAAGGTGTA TCTACTATAT ATAAGCCACT ACTTGGCGAA GATTGTCGTC GTACGATGGA 3660 

CATTTTCCGA CTGTTAGGTG TAGAAATCAA AGAAGATGAT GAAAAATTAG TTGTGACTTC 3720 

CCCAGGATAT CAATCTTTTA ACACGCCACA TCAAGTATTG TATACAGGTA ATTCTGGTAC 3780 

GACAACACGA TTATTGGCAG GTTTGTTAAG TGGTTTAGGT ATTGAAAGTG TTTTGTCTGG 3840 

CGATGTTTCA ATTGGTAAAA GGCCAATGGA TCGTGTCTTG AGACCATTGA AACTTATGGA 3900 

TGCGAATATT GAAGGTATTG AAGATAATTA TACACCATTA ATTATTAAGC CATCTGTCAT 3960 

AAAAGGTATA AATTATCAAA TGGAAGTTGC AAGTGCACAA GTAAAAAGTG CCATTTTATT 4020 

TGCAAGTTTG TTTTCTAAGG AACCGACCAT CATTAAAGAA TTAGATGTAA GTCGAAATCA 4080 

TACTGAGACG ATGTTCAAAC ATTTTAATAT TCCAATTGAA GCAGAAGGGT TATCAATTAA 4140 

TACAACCCCT GAAGCAATTC GATACATTAA ACCTGCAGAT TTTCATGTTC CTGGCGATAT 4200 

45 TTCATCTGCA GCGTTCTTTA TTGTTGCAGC ACTTATCACA CCAGGAAGTG ATGTAACAAT 4260 

TCATAATGTT GGAATCAATC CAACACGTTC AGGTATTATT GATATTGTTG AAAAAATGGG 4320 

CGGTAATATC CAACTTTTCA ATCAAACAAC TGGTGCTGAA CCTACTGCTT CTATTCGTAT 4380 

SO 

TCAATACACA CCAATGCTTC AACCAATAAC AATCGAAGGA GAATTAGTTC CAAAAGCAAT 4440 

TGATGAAGTG CCTGTAATAG CATTACTTTG TACACAAGCA GTTGGCACGA GTACAATTAA 4500 
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AAACTTGTTA GGGTTTGAAT 
ATTTAAAACA AATGCAACAG 
5 . AGTTGCTTCT CTACTTTCAA 
ATCATTTCCA GGATTTTTAC 
GGAAGATATC TATAAATTAA 

JO 

TCGTGTTAAT GAAGCAATAA 
ACTTTACAAT TTTGGATTAA 
ATATCCAGAC GAAAGTGAAT 

15 

AACTGACGAA GCGTTAGAAT 

AGAAGCAGAT TTATATCAAC 
20 AGCACTTGAA CTAGAGCCAA 

TTATGATGGT CAATATTTAC 

ATATCAAGTT AATGGTGTAA 
25 kAACTATAGT GATkCcGATt 

AAGATTATCT CAAAAGAGCC 

AAATAATGAC TACATTACTT 

30 

aATCaTTATA TG 5532 

(2) INFORMATION FOR SEQ ID NO: 531: 

(i) SEQUENCE CHARACTERISTICS: 
35 (A) LENGTH: 942 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 

40 

<xi| SEQUENCE DESCRIPTION: SEQ ID NO: 531: 



45 



50 



AATTGGGTTA 


TACTATAGGT 


AAATTTAAGG 


AGGTAAGAAA 


ATGGATAAAA 


AAGAATTAGC 


60 


GAAATTTATA 


GG CAATAAAA 


TCAGATACTA 


TAGAACCaAA 


TTGaACTTAA 


CTCAAGATCa 


120 


ACTTGGAGAA 


AAACTCmACa 


CTAAAAArGC 


TACTATTTCA 


AATTATGAGA 


CAGGGTACAG 


180 


AACTCCTAAA 


CAAGATGATT 


TGTTTGAAAT 


TGCTCATATT 


TTAAATATCA 


GTATCGATGA 


240 


TTTGTTTCGT 


ACAAGAAATA 


ATAAAAAAAA 


CGACATCACT 


TCCATATACA 


ACAAACTCAC 


300 


ACCTCCCCGC 


CAAGAAAACG 


TACTTAACTA 


CGCAAATGAG 


CAATTAGATG 


AACAGAATAA 


360 
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TACAACCAAC TAATGATGGA TTGATTATTC ATCCGTCAGA 4620 

TTGATAGTTT AACTGATCAT CGAATAGGAA TGATGCTTGC 4680 

GCGAGCCTGT CAAAATCAAA CAATTTGATG CTGTAAATGT 4740 

CAAAACTAAA GCTTTTAGAA AATGAGGGAT AATATAAAAT 4800 

TAGACGATAT CAATCTACAA AAACTAGAAA ATTTAGACTC 4860 

CTACTGACAA CGATGACGCA TTATTTATTC TAGGAGAGAC 4920 

TGCCaCAAGG TTTGGAAGTA TTCCGCGTGT TATATCACAA 4980 

TGCTGATTTA TTTTATTGAA GGTTTAATGT CTGAAAATCA 5040 

ATTTAAGTTA TGTTGAACCA TCACCTGAAA AGTTGATGTT 5100 

AAATTAATAT GATGGAAGTT GCTATTGATA AATTACAAGA 5160 

ATGATCCAAT AATCCATTTT GCATTGGCTG AAATGTTATA 5220 

GTGCTACCTC TGAATAGGAA ACCGTTTTAG AAACTGGTGA 5280 

ACTTATTCTC TCGTATGGCA GATTGTAGTT TACAAAGTGG 5340 

CgCTTATACG ATGrAATTAA TGAAGATGAA ATGACTTCAG 54 00 

ATTTCTnACG ATAAAAATGA CATCACTCAA GAAGCAATTA 5460 

TCTAAAGATC CTGATTATAT TCAAgGCTAC TTGTATTTAC 5520 
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AACTGGTGCT GGCATAGGAG AAGAATTATA TGATGACATA TTGCATGAAG AAGTATTTTT 4 80 

TAAAGAAGAC GAAACGCCAT CAAATGCTGA TTTTTGTATT TTAGTTAATG GTGATTCAAT 54 0 

5 GGAACCTATG TTAAAACAAG GAACATACGC TTTTATTAAG AAAGAAGATT CTATTAAAGA 600 

TGGTACAATT GCACTCGTTG TATTAGATGG AGTAAGTCTT ATCAAGCGTG TAGATATATG 660 

CGAAGACTAT ATTAATTTGG TATCTCTAAA TCCGAAGTAT GATGATATCA AAGTCGCTTC 720 

10 

GTTTAGTAAT ATTAAAGTAA TGGGCAAAGT TGTATTGTGA TTAATAGCGC CTATATGGCA 780 

CTTTAATATA AAAGACGTCT ATTTCAGCAG TGTTTAAAAG GAGTTTATAA TGAAAATAAC 840 

TAATTGCAAA ATAAAAAAAG AAACTATAGT ATATGAAGTT TTAACTAGTG GTAATCAACC 900 

15 ■ ' 

ATTCACTTAT GAGTTACCTA AAGATTTATC GTCACATAAT GC 942 
{2} INFORMATION FOR SEQ ID NO: 532: 

20 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 417 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

< (D) TOPOLOGY: linear 

25 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 532: 
TGGnAAATGC AAACCAAAAT ATGaTCCTCG TGcAAGTTGA AGCGGGACGT TATGAAGAAT 60 

30 

GGGTAAAGAA TGGTTATTTT AAACCGTCAG AAGATAAATC AAAAGAAACA TATACAATTG 120 
TTATCCCGCC ACCAAATGTA ACTGGTAAAT TACATTTAGG ACATGCATGG GATACGACTT 180 
TACAAGATAT CATTACACGT ATGAAACGTA TGCAAGGATA CGATACGTTA TACTTACCAG 240' 

35 

GTATGGATCA TGCTGGTATT GCGACACAGG CAAAGGTAGA AGCTAAATTA AATGAACAAG 300 

GAATAACTAG ATATGATCTT GGTCGTGAAA AGTTTTTAGA ACAGGCATGG GATTGGAAAG 360 

40 AAGAGTATGC GTCATTTATT CGTGCGCAAT GGGCTAAATT AGGTCTAGGT TTAGATT 417 

(2) INFORMATION FOR SEQ ID NO: 533 : 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 733 base pairs 
45 , (B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



SO 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 533: 
GATCCTGAAC CCGCATTTGT TTCCACTAAA ACAGTATGCC CACTTTCTAC TAAAGCGTGC 60 
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ATTTTCATAC 


CATCCACCTC 


CATAATCATC 


TTAACGCGAA 


CATTTTGAAA 


GCGCAATCAA 


180 


AAATCCACAA 


AATTGTAAAG 


GTTATTACAC 


TGACTTTTCC 


GAAAATTGTG 


GTAAAATATA 


240 


ATTAAGAAAG 


AACAAGGAGG 


CACTTACTAT 


GATTACTTAC 


AAAAATATTT 


TAATCGCAGT 


300 


TGACGGTTCA 


CATGAAGCGG 


AATGGGCATT 


TAACAGAGCA 


GTTGGTGTTG 


CTAAACGTAA 


360 


CGATGCGAAG 


TTAACAATTG 


TGAATGTAAT 


TGATTCAAGA 


ACGTATTCTT 


CTTATGAAGT 


420 


TTATGATGCT 


CAATTTACTG 


AAAAATCTAA 


GCATTTTGCA 


GAAGAATTAT 


TAAATGGTTA 


480 


TAAAGAAGTA 


GCTACTAACG 


CTGGTGTTAA AGATGTAGAA ACGCGTCTAG AGTTTGGyTC 


540 


TCyTAAATCT 


ATCATTCCTA 


AAAAGCTTGC 


ACATGAAATT 


AATGCAGACT 


TGATTATGAG 


600 


TGGTACATCA 


GGCTTAAATG 


CCGTGGAAAg ATTTATTGTT GGTTCTGTAT CAGAATCTAT 


660 


CGTTCGTCAT 


GCGCCATGTG 


ACGTGTTAGT 


TGTTCGTACT 


GAAGAGTTAC 


CAGCAGACTT 


■ 720 


CCAACCACAA 


GTT 










733 



(2) INFORMATION FOR SEQ ID NO: 534: 

(i) SEQUENCE CHARACTERISTICS: 
2S (A) LENGTH: 6060 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS: double 
(D> TOPOLOGY: linear 

30 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 534: 
TGATGATCCT GAAGCGCTAT TGGATAATTA CAACACTGAA 
CAATAATATA AATCATGTTA TTTTTGCCTG CGATGCGGGT 

35 

TGCArGCATG TTACGTAATA AATTTAAAAA GGCGGGCATT 
TACTGCGATT AATCAATTGC CAAAAGATGC TCAATTAGTT 

40 TGATCGTGCT ATTAAACAAA CACCAAATGC CATCCATATT 
TTCACCAAGA TATGAAGAAC TTTTAAATAA TCTAAAAAAA 
AAATAAATTA AAAAATGGAG GATACCGCCA TGTTATTGAG 

45 TAGCCCtAtT GATTAAGTAC CACGGtCAAt ATATCACTAT 
TTGCGGTGTC CTCTCGTACT ATTCACCGTG AATTAAAAGG 
CATTTTCATT AACTTTAGAA CGCGCAAACA AAAAAGGGcT 

50 

CTGATTTAAA CGATTTGAAG CAATCGATTG CACAACATCA 
AAGAGCAGAA AGTAATTATT ATATACGCTT TGATACAAGC 

55 



GATGTTGATG CACACAATTA 60 

ATGGGTTCTA GTGCAATGGG 120 

AATGATATTA CAGTTACAAA 180 

ATCACTCAGA AAAAACTAAC 240 

TCAGTGGATA ATTTCCTTAA 300 

GATGATCAAG CATAATAATT 360 

TACACGTGAA AAAGAAATGA 420 

ACACGACATT GCTCAGCAAC 480 

TGTTGAAGCA TATTTAACTT 540 

ACGCATTGCT GGCACAGATT 600 

AACCATTGAC TTATCTGTTG 660 

CAAGGAGCCA GTTAAACAAT 720 
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TAGAGCTTGA TTTAAATAAG TACCAACTAT CTTTATCTCG AAAGCGTGGC GAAGGCATTT 840 

ACTTGGTAGG TACTGAATCA AAGAAACGTG AATTTTTAAG TCAATTAATG GTGAATAACT 900 

TAAATAGTAC TAGCGTTTAT TCAGTAATTG AAAATCATTT TGTCTTTCAT TCATTAAATC 960 

AAATCCACAA AGACTTTGTT GACTTAGAGC GCATTTTTAA TGTTGAAAGA CtATTaATGG . 1020 

ACTACCTAAG TGCCTTACCC TACCAACTTA CCGAATCAAG TTATTTAACT TTAACTGTCC 1080 

ATATCGTGCT CTCCATTTCA CGTATAAAAA ATGGAGAGtA TGTCGCATTA AACGATGATA 1140 

TTTATGATTC TGTACAAAAC ACATTTGAAC ACAAAGTaGc AAGCGAACTT GCTGATAAAC 1200 

TTGGTCAAAT ATATGACGTC ACGTTTAATC AGGCAGAAAT TGCTTTCATT ACTATCCATT 1260 

TACGTGGAGC TAAACGAAAA AATCTTAATG ATACATCATT AAATAATCGT TGTGAAGAAA 1320 

ACAAAATTAA AGCGTTTGTT AACAAAGTAG AAATGATTTC CGGTATGACA TTTGCAGATT 1380 

20 TGGATACTTT AGTAGATGGA CTGACGCTAC ACCTTAATCC TGCAATCAAT CGTTTGCAAG 1440 

CTAATATCGA GACCTATAAT CCGTTAACAG ACATGATTAA GTTCAAATAT CCAAGACTAT 1500 

TTGAAAATGT AAGATTAGCT TTAAATGATT GTTGGCCTGA TTTGATTTTT CCAGAGAGTG . 1560 

25 AAATTGCTTT TATAGTtTTA CACTTTGGTG GCTCGATTAA AAACCAAGGT AATCGATTTT 1620 

TAAACATATT AGTCGTTTGC AGCAGTGGTA TGGGAACTAG TCGTCTATTA TCAACTCGTC 1680 

TAGAGCAAGT TTTTAGTGAG ATTGAGCGTA TTACACAAGC ATCAGTCAGC GATTTGAAGT 1740 

CACTAGATTT AAGTCAATAT GATGGCATTA TTTCTACTGT GAATTTAGAC ATCGACTCCC 1800 

CCTATTTAAC GGTAAACCCA TTATTACCAG ATAGTGATAT CAGTTATGTC GCACAGTTTT 1860 

TAAATACAAA GTCTACGTTC CAAGAGACGC ATGATAAATC ATCAAACATG ATTGATAAGG 1920 

ATGATGTTCA TGTTGAAACG AAAGATGTTG ATGGCAACAC ATCTTTTGAA AATGAACAAA 1980 

CTTCATACTT AACTTCAGTT TTCGAAAAAC ATTTAAGTGA CGAAAAATCA GAACAATTAT 2040 

TGCATCATAT GCGTTCGGGT TTAACTTTGC TTGATTCAGT GAAAATAGTT AGTACCGAAG 2100 

TTAAACAGTG GCAAACATAT ATCGCAGATT ATCTATATCA ATGCGATGTA ATAAACGATC 2160 

CAACGTCATT CGCTGAACTA CTAGAGCAAC GATTGATTGA CAATCCAGGA TGGATATTAA 2220 

45 GTCCATATCC TGTTGCAATA CCACACCTAA GAGACAATAT GATTAAACAC CCTATGATTC 2280 

TAATCACAGT TTTAGAAGAA CCGTTAACAT TGCCTAGTAT TCAAAATGAC AATCAAACAA 2340 

TTAAATATAT GATTTCCATG TTTATTTCTG ACAATGATTT TATGGCATCA CTGGTAAGTG 2400 

50 

ACTTGTCCGA ATTTTTAAGT TTGAAATTAG AATCTATTGA TACTTTTATG GAAAATCCAC 2460 

AGGAACTTGA AACATTATTA AGAAACAAAT TTTTAGAACG AATTAAAAAA CAATTTATTT 2520 

55 



30 



35 



40 



1467 



EP0 786 519 A2 



TAACAGCCAA AATGAAGCAA TTGAAAAAGC AGGTAAAGCC TTAGTTGATA GTGGTGCTGT 2640 

AACAGATGCT TATATTCAAG CAATGAAAGA TCGTGAGCAA GTCGTATCAA CATTTATGGG 2700 

5 

AAATGGCTTA GCAATTCCTC ATGGCACAGA TGAAGCTAAA ACAAATGTGA TTCACTCAGG 2760 

TTTAACATTA TTACAAATCC CTGAAGGCGT TGACTGGGAT GGCGAAGTAG TTAAAGTTGT 2820 

CGTGGGAATT GCTGGTAAAG ATGGCGAACA TTTAGACTTG TTATCTAAAA TTGCAATTAC 2880 

ATTTAGCGAA GAAGAAAATG TGGATCGTAT CGTTCAAGCA AAATCTGCAG AAGAAATTAA 2940 

ACAAGTATTC GAGGAGGCAG ATGCATAATG AAAGCAGTTC ACTTTGGTGC TGGTAACATA 3000 

15 GGTCGTGGTT TCATTGGTTA TATTCTgCAG ACAACAATGT TAAAGTAACA TTTGCAGACG 3060 

TCAATGAAGA AATCATTAAT GCTTTAGCTC ATGATCATCA ATACGATGTT ATTTTAGCTG 3120 

ATGAGTCTAA AACAACGACG CGCGTGAAtA ATGtTGATGC AATTAATTCA ATGCAACCTT 3180 

20 CTGAAGCGTT GAAACAAGCA ATTCTAGAAG CTGATATTAT TACAACAGCT GTTGGTGTTA 324 0 

ACATACTACC TATTATTGCT AAATCTTTTG CGCCTTTCTT AAAAGAAAAA ACAAACCATG 3300 
TTAATATTGT TGCTTGTGAG AATGCTATTA TGGCAACTGA TACATTGAAA AAAGCAGTAC . 3360 

25 TTGATATTAC TGGCCCTCTT GGTAACnaTA TTCATTTTGC TAACTCAGCA GTTGATAGAA 3420 

TTGTACCATT ACAAAAGAAT GAAAATATAT TAGACGTTAT GGTTGAGCCA TTTTACGAAT 3480 

GGGTTGTTGA AAAAGATGCA TGGTATGGTC CAGAACTAAA CCATATTAAA TATGTTGATG 3540 

30 

ATTTAACACC ATATATTGAG CGTAAATTAT TAACTGTGAA TACAGGACAT GCATATTTAG 3600 

CGTATgCTGG tAAATTTGCA GGTAAAGCTA CAGTTTTAGA TGCAGTTGAA GATAGTTCAA 3660 

^ TTGAAGCTGG CTTACGCCGT GTTTTAGCTG AAACTAGTCA ATATATTACT AATGAATTTG 3720 

ATTTTACTGA AGCGGAACAA GCTGGTTATG TTGAAAAAAT AATAGATCGT TTCAACAATT 3780 

CTTATTTATC TGATGAAGTA ACACGTGTCG GACGAGGTAC ATTACGTAAA ATTGGCCCTA 3840 

40 AAGATAGAAT TATAAAACCA TTAACATATC TTTATAATAA AGATTTAGAA CGCACTGGTT 3900 

TATTAAATAC AGCTGCATTG TTATTGAAGT ATGATGATAC AGCAGACCAA GAAACTGTTG 3960 

AGAAAAATAA TTACATTAAA GAACACGGTT TAAAAGCGTT TTTAAGTGAA TATGCTAAAG 4020 

45 TTGACGATGG CTTAGCCGAT GAAATAATTG AAGCGTACAA TTCACTTTCA TAATTTATTG 4080 

AGCTTTGTTT GAAACAAGAA GTTTCCAACG TTATTCGTTA ACAATCAGTA ATAATGTAGT 4140 

AGTTCCCTTG AATTAACAAT ATTAAATTTC TGAACATAAA AAATACTCCC TTCAACATAG 4200 

SO 

ACACTTAACT TGTGTTATGT ATGAAAGGAG TATTTTTGCG TTAATAATTT GTTTTATTTT 4260 

CGAGCCACAG CCACCTATTC AATGGCTATT GGTCATTACT AAAACAAATT CATATTAACT 4320 
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TTGAATAAAT TTTATTCTTC AGTTTGTTGG TCTTTCTTAG TGAATCTTCT AATTAAGAAT 4440 

GCCATACCTG CACCTAGAGC TAATTCAGCA TATGGTAAAT CGTCATTATG TGACATACCA 4500 

GTATCTGGTA AAGTTTTAGC TTGTTGTTTA GCTTTATTAA CTTTTCCTTG TTGAGCTGAT 4560 

TTTGTCTTAG CTTGGTGGTC GTCAGTGTTA GTTACATTAA GCATATCTTG ATTAGCACTA 4620 

TTGCTTCCAT TTGAAACTGT AGCTGGAGAT GCATTGGCAC CGTCGTTTTG CGTAgyTTTA 4680 

TTGTTTGCAG CTGAACCAAC TGATTTTTGC GTATCATTAG TATCTGCTGT TGCCGTATCA 4^40 

TCTTTTTGGC TAACATTAGT TGAAGTCATT TTTTCTTTTG CTTCAGAAGA TGCAGATGTT 4800 

GATGGTTTAT TCGAAACTTC AGTATCAGCT TTGCTTGGCG ATTTATCTGC TTCGTTAGAT 4860 

GCAACGTTAG TTTCAGACTT AAGTTGTCCT GCATCAGTTT GATTTGTCGT ACTTTCTTCT 4920 

TTATCTTTTG ATGTATTAGA AGGTACATTT GGTTCTGTTA TGTCTGCTGA AGGCAATGTT 4980 

20 TCAGTTGTtG ATTCAACCAT ACTTTGATTT GTTGAATCAC TACCATCTTT TTCTGCCTTA 5040 

GCTTTATTTT CAGATTTTGG TTGTGCAACC TTGTCATTAG TTGATTGAGA TTCAGCACTA 5100 

TTATTTACTT CAGCATTTTG TTTTGAATCA TTTACAGATG CATTATCTTT GCTATCAGCA 5160 

GATGATGCTG CTTCTGTGCT CGCAGTTGTT GGAGCCGTTG CTGTTGATCC TGTTGGTGCA 5220 

TTCTCGTTTG TTGCTGTAGT TGTACTATTG TTATTTGTTG TGCTTTCTGC TGGCGTTGCA 5280 

TTATCAGTTT CTGTTACAGG TTTATCAGTT GTGCCGTTAT TAGTTGATTC TACTTCTGGT 5340 

TTACTAGTTA CATCGTTATC CATTGTCGGA CTGTTTGTTG ATGCATCTAC ACTAGAATTG 5400 

TTATTAGCTT GCGGTTTATC ATTTGCATCA TCAGTTGCTG ATGTTGCTGT TGTTTCACCT 5460 

GTTGCCGCAT CACTATTATT TGGTGTTGTC GGAGAAGCGT CTGCTTTGCC ATTAGCTGTC 5520 

GTCTCAGATA CGTTAGGTTG TCCAGTATTT TCTGGTGTTG CATTAGCATT TGAATTTGCT 5580 

GTTGCATCAT TATTATCTAT ACCATTATTA GTATCATTAG CATCTGGATC ATTCTGAGGC 5640 

40 ACAATCGCTT CAATTGCAGG TATCGTTACA TTTTGTAATT CAGCAACTTC TGCATTTGTT 5700 

TGTGTTTTAT CTAATTTATC AGCAAATCTG TCAAAATATC TACCTAAATC CGTACGTGCA 5760 

ATTTCTTTCG CCGATGCATC TGCATCTGCA TTTTTAATTA TTTCTATTTG CTTGTTAACC 5820 

45 ACTTCTCTGA TTGCTTCCAA AGCATTTTTC TTAACTTCAG GATTAATACG TTGTGCTTTA 5880 

AGTTGTTCAA GCGCACTATT TTTGACAGTA GCGATTTCTG CATTTGTAGT TTGATCAGAA 5940 

ATATCTTCAG TTGCTTTTGA TAAAATGTCT TCTAAAGCAT TCGTAAACGC TTCTTTTTCT 6000 

50 

TCAGTTGTAG CATCAGCGTT GACATTTACA CCTGCTTCAA TCTGGTCTAG TGCAGTTTCT 6060 
(2) INFORMATION FOR SEQ ID NO: 535: 

55 
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(A) LENGTH: 977 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
<D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 535: 



10 


AACAAAGCCT 


TCCAATTATC 


TGCGTCGGTA 


GAACAAGTAT 


TAGCAACTTT 


ATCACCTACG 


60 




CTAAACAGTC 


CTTACGATTT 


ATACGGCACG 


ACAAAAATGC TAGATATTAC 


ATTCGATTCA 


120 




TTTGAACATG 


ATGGTACAAC 


GTACCCTGTC 


GACTATGCTA 


CGTTTGAAAA 


TGATTATGAA 


180 


15 


GATAATAAAG 


ATCCTGAGTT 


TAGACGTAAA 


AGTTTCAAAT 


CGTTTAGCGA TGGGATTCGA 


240 




AAATATCAGC 


ATACTACCGC 


GGCTACATAT 


AATATGCAAG 


TACAACAAGA 


AAAAATTGAA 


300 


20 


GCTGATTTAC 


GTGGATTTGA 


ATCAGTCATC 


X X t\ x x xnx 


TACATAGTCA AGAAGTAACG 


360 


CGTGATATGT 


TTGACCGTCA 


AATCGATATG 


ATTATGCGTG 


ACTTGGCACC 


AGTTATGCAG 


ion 




AAATATGCTA 


AACTTTTACA 


ACGTATTCAC 


GGATTAGATA 


ACATGCGTTT 


TGAAGACTTG 


480 


25 


AAGATTTCTG 


TAGACCCTGA 


TTATGAACCA 


GAGATTTCAA 


TTGAAGACTC 


AAAAAATTAT 


540 




ATTTTCGGTG 


CGTTAAGTGT 


TTTAGGTGAT 


GACTATACAA 


ACATGTTACG 


TGAAGCATAC 


600 




GATCAGCGAT 


GGaTTGATTT 


TGCACAAAAT 


AAAGGTAAAG 


ATACAGGCGC 


ATTTTGTGCA 


660 


30 


AGTCCATACT 


TTACACATTC 


ATATGTGTTT 


ATTTCTTGGA 


CTGGTAAAAT 


GGCTGAAGCA 


720 




TTTGTCTTAG 


CACATGAATT 


AGGTCATGCA 


GGTCATTTTA 


CATTAGCTCA 


AAAACATCAA 


780 




CCATATCTTG 


AATCAGAAGC 


ATCAATGTAC 


TTTGTTGAAG 


CCCCTTCTAC 


AATGAATGAA 


640 


35 


ATGTTGATGG 


CCAATTATTT 


ATTTAACACA 


AGTGATAATC 


CAAGATTTAA 


GCGTtGGGTT 


900 




ATTGGCTCAA 


TTTTATCTAG 


AACATATTAT 


CATAATATGG 


tACCCmTTTA TTAGAAGCnG 


960 




CTTATCCACG 


GGGAGTG 










977 



40 

(2) INFORMATION FOR SEQ ID NO: 536: 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 144 0 base pairs 

(B) TYPE: nucleic acid 
45 <C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

SO (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 536: 

AGACAGTGAT yGaATTTCAT TTACAGTACA CAAATCATCG AAAAATTGGT AACATTCTTC 60 
TCTATTTTCT AACGTTAgwA TTgCATCAAA CAATTCATCT AACGCTGCAC CTCGTAATTT 120 
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5 



15 



25 



AATCTATTAA 


AGTGTAGCGa 


TTTATATTTT 


ATTAAATCTG AATCGTTACT 


TTATTTAATT 


240 


TTATGCTAAT 


CCAGCGCGTT 


CGAAAATAGT 


GTCAACTTGa 


TTCAAATGAT 


GTTTAGGATC 


300 


GAAACATTCA 


TCCAATTCTT 


CTTTTGTTAA 


AACACTTGTA ATAGACTCAT 


CTTGTTCGAT 


360 


TAATTCACGG 


AACGGTGTTT 


TCGTTTCCCA 


AGATATCATC 


GCTTTTGGTT 


GTACTTTGTC 


420 


GTATGCTTCT 


TCACGAACCA 


TACCTTTATT 


AATTAATGCT 


AATAAGACAC 


GTTGTGAGAA 


480 


AATCAGACCA 


AATGTTTTAT 


CTATGTTATT 


ACGCATATTA 


TCTTCAAATA 


CAGTTAAACG 


540 


GTCCACAATA 


TTTGTGAACG 


ATTCAATGCA 


TAATCTAGTG 


CtATTGTAAC 


ATCTGGTAAC 


600 


ATAATACGCT 


CAGCAGAAGA 


ATGAGAAATA 


TsTCTTTCAT 


GCCATAATGG 


CACATTCTCA 


660 


TAAGCTGTAG 


TAATATAACC 


ACGAATGACT 


CTTGAAATAC 


CTGTGATATT 


TTCAGAACCA 


720 


ATTGGATTTC 


GTTTATGAGG 


CATTGCAGAT 


GAACCTTTTT 


GGCCTTTTGC 


AAATGCTTCT 


780 


TCAACTTCTC 


TCGTTTCGGT 


TTTTTGAAGG 


TTACGTATTT 


CAACGGCAAA 


TTTTTCTAGT 


840 


GATGTCGCGA 


TTAATGCTAA 


TGTCGCAATA 


TAGTATGCAT 


GTCGATCGCG 


TTGCAATGTT 


900 


TGCGTTGATA 


CAGGCGCTGT 


GCCAATACCT 


AAATGTTTAC 


ACACATAACT 


TTCTATTTCA 


960 


GGAGGAATGT 


TAGCAAAAGT 


ACCTACTGCA 


CCACTCATTT 


TCCCTACTTC 


AATTTCTTCT 


1020 


CTTACTTGTT 


TGAAACGTTG 


TAAGTTACGT 


TGCATTTCCG 


TGTACCACAA 


TGCCATTTTG 


1080 


ACACCAAATG 


TAGTTGGTTC 


TGCATGCACT 


CCATGTGTAC 


GTCCCATCAT 


CAATGTATAT 


1140 


TTATAATTTT 


TTGCTTTTTC 


AGCTAAAACG 


TCGATAAATC 


TTTCTAAATC 


TTTTTCAATA 


1200 


ATGTCATTTG 


CTTGTTTAAT 


AACGAAACTT 


AAAGCTGTAT 


CTACAACATC 


AGTAGAAGTT 


1260 


AAACCATAAT 


GTACcACTTA 


CGTTCTTCAC 


CTAGCGTTTC 


AGAAACTTGT 


CTAGTAAAGG 


1320 


CTACAACATC 


ATGGCGCGTT 


TCTTGTTCAA 


TTTCTTGTGC 


ACGTTCGACA 


TTTACCTTTG 


1380 


CGTTTTGACG 


AATTTTTTGT 


ACGTCAGCTT 


TCGGTATATG 


TCCTAATTCA 


CTCCATGCTT 


1440 



(2) INFORMATION FOR SEQ ID NO: 537: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 784 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 537: 

50 > 

GATAAATCTA TnCAGTTTCC GTCCAAATAT CtGCaCCTAA AGCTTTTAaG TGTTCTACAA 60 

TATCTgTATA ACCTCTATAA ATATGTTTAA CATTGTAAAT TGTAGTTACA CCCTCAGCAA 120 
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10 



CATGTAATGT TGATGGTTTT ATCGTTGCTG TGCCTTCGTC AACTTCAATA TTTGCACCCA 240 

TGCGCTTTAA TTCTTCAACA TGTTTAAAAC GCTCCGGATA AATCGTATCA GTTACAAATG 300 

AAGGACCATT TGCCATAAAT AATAATGGTG TAATAGGCTG TTGCAAATCA GTAGCAAAAC 360 

CTGGATATAC TAGTGTTTTA ATATCAACAA ATTGATATGG CGCATTATTA TTGATGCGAA 420 

TTCTTTCGTC TCTTACATCA ACATTCACAC CTAATTCACT AAATTTAGCA GTTAATGTTT 480 

CTACATGTTT CGGAACAATA TTATTTAATA TAACATTTTC TCCACATGCT GCAGCGATAC 540 

ACATATATGT GCCTGCTTCA ATTCTATCAG GTATAACTTG ATACTCAGAA CCATGTAATT 600 

JS CTTTGACGCC ATTGATTTTA ATTGTTGATG TACCCGCTCC CTTAATATTA GCTCCCATAC 660 

TTGTTAAGAA GTTAGCAACA TCAACTACTT CCGGTTCTTT AGCAGCATTT TCAATTACAG 720 

TTTGTCCTGT TGCATAAACT GCAGCTAGCA TAATGtnAAT TGTTGCACCT ACGCnAACCA . 780 

20 TATC 784 
(2) INFORMATION FOR SEQ ID NO: 538: 



25 



30 



35 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3733 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 538: 

CAATCTCCAC CAATGACACG TCGTCATTCG TGACCTCATA CCArACAAAA AACAGTCTCG 60 

CAATCAAGAC TGTTTTCCAC TCAATATATT CATCCATTAG CGTAATAGAT TATTTGACTT 120 

CTGTAGCTAC AAAGaTTTTA CGTTTTTCCC AAACGCCTGT cTTTTCATTG TAATCATCAC 180 

AAGTAATTAA TGTTAATTGT TTATCTTTAC CTTTTTGTTC ATCTAGAAcT CCTACATCTG 240 

40 TAGGCTTAAC ATCTCTTATA CTTGTCATTT TATACTTACG TGTTTCATTA CCAACTTTAA 300 

AGTACACCAT ACTACCTTTT TTGGCTGCTT TAAGATTTGT AAATTGATAG TTCGGACGGT 360 

CAATGAAAGT GTGTCCTGCA ATTGAAATAT TTTGATCATC TAGTGATTCA TTTTCTTCTG 420 

45 CAAAGCTTAC ACCTCTATTT AATTGTTCAG GTGTTGCTGG TCCTGGATAT ACTGGTTCTT 480 

TAATATCAGC ATCTGGAATT TCAATATAGC CTGCCACTTT CGATTTATCT TTCGGAATTT 540 

GAGGTTTAGC TTGCTGCTTT TTATCTTTAC TCGCCTGTTC TTTTACATTT TTATCATATT 600' 

SO 

GTTCAATCTT TTCATCTTTA TCTTTATCGT GAAGATAATT ATCGATATGT GGTTTAGCAA 660 

ACAAATATGC TGCCACTAGG aTAAGTACCA CACCAGCGAT TGTCATTAAT CGATTTGTCC 720 
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15 



AGTATACCAT TAATTTCAAA ATGACTCATA GCAATTCATT TTATACTATA AAATTTACAT 84 0 

GTATACTTTT ACGTTAGATT TCATTACACA TATTTGCATT CAAATAACGA AACGCTTTTA 900 

ATAATTACTA AGGGGGAATT GATATGATTA GATACGCTAA AAAAGAGGAT TTAAACGCTA 960 

TATTAGCGAT ATACAATGAT GCCATTATCA ATACTACAGC TGTTTATACT TATGAACCAC 1020 

AAACCATAGA CGAACGTGTC GCATGGTTTG AAACGAAACA ACGTAAGCAT GAGCCTATCT 1080 

TTGTATTTGA GGAAAATGGA AGTGTCTTAG GGTTTGCGAC GTTCGGTTCA TTTAGACCTT 1140 

GGCCAGCATA CCTATATACA ATCGAACATT CTATTTATGT CGATGCTTCA GCTAGAGGAA 1200 

AAGGTATTGC TAGTCAATTA CTACACCATT TAATTGTGGA AGCAAAAGCT AAAGGTTATC 1260 

GTGCGCTAGT TGCAGGCATT GATGCTTCCA ACAAAGCGAG TATTCAGTTG CATCAAAAGT 1320 

TTGCTTTTAA GCATGCCGGC ACACTGACCA ATGTAGGTTT TAAATTTAAT AGATGGTTAG 1380 

20 ATTTAGCATT TTACGAATTA GATTTACAAG ACTAGTAATG TTTGAATCAC ATAATATAAA 1440 

CAAGACAACC ATGTTAATTC CCTTAACATA ACAAGCCAAC ATATAAAATT TTAAACTTCT 1500 

CAGGGGAGTG GGACAGAAAT GATAAAGAGG CACTAATGAT TTATTATGTA GTGGTTCTTA 1560 

25 CACATTAGCC ACAGCTAATG TGTAcTTAAA AATAGGAATA CATGAGTAAA ACTCATGCAT 1620 

AAGAAATACT AATTTCTATA GAAAAAGTAT TTCTTTATCG TCGTCCCACC CGAACTCGCA 1680 

CATTATTGTA AGCTGACTTT TCGTCAgCTT cTGTGTTGGG GCCCAAAAAG CTTGTTACAA 174 0 

GCGCATTTTC GTTCAGTCAA CTACTGCCAA TATAACTTTG TAGAGCATAT TACATTGATT 1800 

TACATTGTCC CTTTTATTTA TTCTTTTCAA ATACTATCCC CATAGCTTTG ATTTAACGCT 1860 

TTTTCTCAAT AACAAAACGA ATATAGTAGA ACATGAAAAC GATAATCATG CTGAGCGATA 192 0 

AAGATTTAAA TAATAGATTG ACCCACGTTG CCTCAGTCGT ATATCCATAT GTAATCGTTG 1980 

TGTTAATGAT GAATGCTATA AAGATGATTG ATAGTCTTAG CATATCATCA CTCCTTTTAA 2040 

GTTATTTTAG ATATACGGGG GCGCTTTTGC AATCACTATT TTGATTAGTA TGCATTTTCC 2100 

40 

ATAAATCTTT CAACTTCTTC . AGAGATAATT AAGAAGCATC TATCTGGTAC TAATGATCCA 2160 

GACAGATGCT TCTTTTTTAT CAATATTTTA TTGTTATCTC ATTAATTATT TTTAACCATA 2220 

45 TCTTCAGCTG TGCCAAAGAT TTTACGTTTA ATTGCTTCGC CAGTTGGTGT GCCTGCTAGT 2280 

CCACCCAATC CAGTTTCACG TAATGATGCA GGAAGGTTAC GACCAACCTT ATCCATTGCT 2340 

TCAATAACTT CATCAACAGG GATTCTACTT TCAATACCTG CTAATGCTAA ATCTGCTGAA 2400 

so ___ 

ATTAAAGCGT TACCCGAACC AATTGCATTT CTCATAACAC AAGGAATTTC AACAAGTCCG 2460 

GCTACTGGAT CACAAACTAA ACCTAATAAA TTACTTATCG CTAATGCCAT AGCGTGCCCG 2520 
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GAACCAACTT 


CAGnTTGGCA 


GCCACCTGTT 


GCACCAGCTA 


CACTTGCATT 


GTTTGCTACG 


2640 


ACACGCCCAA 


ACAATGCTGA 


AGTGAATAAG 


AAATCAATCA 


TTTGCTCTTC 


TGTTAAATCA 


2700 


TGTGTTTTTT 


CTAATTTAAA 


AAGTGCACCG 


GGAATGGTAC 


CCGAGGAACC 


AGCTGTTGGC 


2760 


GTtGCACAAA 


TAATACCCAT 


CGCAGCATTG 


ACTTCATTTG 


TTGCAATGGC 


AcCtTTGcTG 


2620 


CGTCAATCAT 


TTCATATCCA 


GACAAAGCAT 


GATGTGTTTC 


ATTATAATCA 


CGTAGTTTAG 


2880 


CAGCATCATG 


ACCAGTGTAG 


CCCGTTACAC 


TTTCAACCCC 


ATCACCTGTC 


GTCCCTTTGA 


2940 


TTACTGCGTC 


TCGCATGACA 


TCTAAATTTT 


GTTTCATTTG 


CGCTCGCACT 


TCATCACGTG 


3000 


ATTTACCGCT 


TAATTCCATT 


TCTTCTTTAA 


CCATGATATC 


CGCAAATGAC ATATTATTTT 


3060 


CTACGGCATA 


ATCTATAGTC 


TCTCTAATTG 


AATCAAACAT 


GTTTATTCCC 
TATTTAATGT 


CCTCTAATTT 


3120 


ATATAGGAAA 


CGTTTACGTC 


ACTGTATTTC 


TCTTTAATTG 


TGATTCTGAG 


3180 


ATTGCTTTAT 


TTAATGGTAT 


TACAACCAAG 


CATTTATCTT 


CATCTATCTT 


AATAAATTCA 


3240 


TCTTTACAGT 


CTAATTTCAT 


ATCGTTGATA 


TCATTGATGA AATGATTTAC 


TTGTGCTTTA 


3300 


GTCATATTTC 


CGTCAACAAC 


TAAAATTGGT 


AATCCATGAT 


TTAAATCTAC 


TTCTAGTCCA 


3360 


TTTATATGAA 


TACCTTTAAT 


TTTAATTGTA 


CCACCACCGA 


TTGAAATACC 


GATAATTTCA 


3420 


ATGTAGCGAC 


CATCATTACG 


AGATGATTTG 


ATATAAGCAC 


AGTTTGGATG 


TTGACCAATA 


3480 


CTATCGCCTT 


CTTCTTCGAT 


GATATGTATT 


TTAATACCAT 


CATCAGCTGC 


AATTTCTAAT 


3540 


GAAGATTTAA 


TTCGGTTATC 


AAATGTTGAA 


TATCCCATTG 


CTCCACCCAC AATAGCGACA 


3600 


TCTGTACCAT 


GTCCTTGGTG 


TGTTTGAGCA 


AATGATTCAT 


AATAATGTAT 


TTCAATATTT 


3660 


TTATATCTCC 


CAATATTGCG 


CGTGCTGAAT 


TCCCCTTTAC 


TGCACCAGCC 


GTATGAGAAC 


3720 


TTGAAGGGCC 


CAT 










3733 



(2) INFORMATION FOR SEQ ID NO: 539: 



(D SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 52 5 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY : linear 

45 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 539: 
TGGCTGTCTT CTCTATGAGT GTAGTAAGTA AGTTAACGGA TTTAACGCCA AGGCAAATAC 60 
50 GTTACTATGA AACACATGAA CTCATCAAAC CTGAAAGAAC AGAAGGTCAA AAACGTCTGT 120 
TCTCACTCAA TGATTTGGAA AGATTACTAG AAATTAAATC ATT ATT AG AA AAAGGATTTA 180 

55 
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AAGAGATAAG AAAAAAGATG ATTGTAGATG CCACGCAAAA GCCTATTGGA GArACTTTGC 300 
CAATAAATCG TGGTGATTTA TCCCGATTTA TT AAAT AAAA . TTTGGAGG AT TTTAAAATGC 360 

5 

CAAAACGTAC TTTCACTAAA GACGACATTC GTAAATTTGC AGAaGAGGAA AaTGTAaGaT 420 
ATTTAAGATT ACAATTCACT GATATTTTAG GAACAATTAA AAATGTTGAA GTGCCTGTAA 480 
GCCAATTAGA AAAAGTACTT GATAACGAAA TGATGTTTGA CGGTA 525 

10 

(2) INFORMATION FOR SEQ ID NO: 540; 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 14 08 base pairs 
J5 (B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

20 (x'i) SEQUENCE DESCRIPTION: SEQ ID NO: 540: 



25 



30 



35 
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45 
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TTGATTTGCT 


ACAAAGTATC 


TnCTCATTTC 


TGTATCCTGA 


AAAATCTTTA GTGTAATAAT 


60 


GTTGTTCAGT 


TTTAATATTT 


TCAGTCATAG 


TTGACTACCT 


CCGTATATTT 


TGATTTAATT 


120 


AAGTTGTATA 


TTTTGATGAA 


CACTTATTGT 


TACTTGTTGG 


CGCAAGTAGC 


AGTTTTTTCA 


1B0 


TTCTTCATAA 


AAGTATTCCT 


TATAGAATAT 


GAATGTTGCG. 


ATACTTGCGA 


ATCCTGCAAT 


240 


TGaCCATGCT 


GtAGTGAAGT 


ATAGAAACGG 


CATAAGTACA 


ATCGCTAAGA 


CTGTGAAGCA 


300 


TAGTACTGCT 


ACTAGGTAGC 


TTTTATAAAT 


GTTACTCATT 


TTCTTTTTTC 


AACTCCTCCA 


360 


TTATTCTCTG 


GTCTGATAAG 


TCGTGATAAG 


GGAATTTTTT 


CCtAGCTAAT 


TGGACTGGTA 


420 


TTCTGCCTCG 


TATCGCAATG 


TATCCTTCAT 


CTTCAAGCTC 


TTTATTCAGT 


TCTCTTATTA 


480 


TTTGTCCTGC 


TTTGGATTTA 


GAAACAGATA 


AAATTACCgC 


AAGTTCTTTA 


GCTTGCAAAC 


540 


TATTTTTCAT 


CATATCTTTT 


CCTCCTTTAA 


AATAACTGTT 


GATTCTCTGG 


GTTATCTGCT 


600 


TCGTAATTAT 


CTGCAATAAT 


ACTTTTAGCG 


AAAAAGTCCA 


AACTGACCTT 


ATATAGGTTG 


660 


TTCATAGATT 


TCTTTACGTT 


AACCCCTTCC 


TCAAGTACAT 


AAGGCACCCT 


AAAATCATTT 


720 


ATAAACAGTC 


CGTTTTCGTC 


TAAAGTAACG 


GTTGGTAATT 


CAGGTTTGTT 


CCGTCTATAA 


780 


ACTTCTCCTA 


GTGTAGGTTT 


TTGCTTTTCA 


GCTTGTTTAG 


TGAAGTCGGA 


AAATGCCTTA 


840 


AGTAGTTTTA 


TTCCTGAATC 


AGGATCACTG 


TGTCGCTCAA 


TCGTTTCTGC 


TGTAGACTCT 


900 


TTACTAAAAT 


CATTTCTATT 


GATTACAGGC 


TTTCTCGTAT 


TTCGTTCAAT 


CTTCCAAACC 


960 


TTCCACGTCA 


CAACTGCCAT 


TGTGGTGAGG 


AGGGTTGTTT 


TGTATAGTGC 


GTTCATTTGT 


1020 


AATTCCTCCT 


ATTAAGTTGT 


TTGTTCAATT 


GTGTGTGTTA 


TTCTTCTTCG 


TCTAAATCAA 


1080 
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CGACTTCGTA AGTGTGCTCA ATCTCGCCTG cATATGTCAC AGTAAGAGTA TCTTTGTGTG 



1200 



TGTATGTTTG ACTTTTGTTy TCTtTAACTG CATAAAGTGT TAATACTATA TTGTTTAGCT 



1260 



TTyCTTTTTG TTCTGGTGTC ATTTACGCTC CCCCTAmATT AGCyTCATAA CCGAATTCAG 



1320 



TCATGATTTC ATGTATTTTC AATCTGCCTT TTTGTGTCCA TCTAGTTTGT AAAACTGTGT 



1380 



CTTCTCTGCC ATCAGAACGC ACAATTGT 



1408 



10 



15 
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(2) INFORMATION FOR SEQ ID NO: 541: 

<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4 32 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS ; double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 541: 

GTTCGTCAAT GATTTTTATC CGATGCTATG AGCATTaTCA AATACAAAAT GCTCTCTTAA 60 

AAGCAGTTAT TGACTGAAAA TCTACTTCTA AGAGAGCACT TTATTTAATT ACTTAAGAAA 120 

TCTTGAAATT TCAATATACG ATGTTTATGA TAAGTCGCTT ATTTCATCTT TAGGCTTGTT 18 0 

ATTAGTAAGT AGTTTAATAC CACTGATTAA CCATAAAGCA AATGTAATTA TGTTACCACT 24 0 

TATTACAGCT CCAATAATCA ACAATATACC ACTCATTTTT TTGTTTTTAG ATGCTTTAAA 300 

CATACCGATT GCACCTAAAA TAATTGAAAT GATTCCAAAT ATGAATAGGG ATAAGAATAA 36 0 

TACAGTGAAA ATTGCTGCTG CTGTTTCTGc ATCAACTGGG nCAACCTCAC CATTAACTGT 420 

TGTTGGACAC AT 432 
(2) INFORMATION FOR SEQ ID NO-: 542: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2426 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
<D> TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 542: 

ATAATCATGA AGTnGCTAAA nCGCCAAATA ATGATGGTTC TGGACATGTT GTGTTAAATA 60 

AATTCCTTTC AAATGAAGAG AATCAAAGCC ATAGTAATCG ACTCACTGAT AAATTACArG 120 

GAAGCGATAA AATTAATCAT GCTATGATTG AAAAATTAGC TAAAAGTAAT GCCTCAACGC 180 

AACATTACAC AT AT CAT AAA CTGAATACGT TACAATCTTT AGATCAACGT ATTGCAAATA 240 
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GTATAAAAAG TCAACGAAAT ATTATTTTGG AAGAACTTGC ACGTACTGAT GATAAAAAGT 360 

ATGCTACACA AAGCATTTTA GAAAGTATAT TTAATAAAGA CGAGGCAGTT AAAATTCTAA 420 

AAGATATACG TGTTGATGGT AAAACAGATC AACAAATTGC AGATCAAATT ACTCGTCATA 480 

TTGATCAATT ATCTCTGACA ACGAGTGATG ATTTATTAAC GTCATTGATT GATCAATCAC 540 

AAGATAAGTC GCTATTGATT TCTCAAATTT TACAAAOGAA ATTAGGAAAA GCTGAAGCAG 600 

ATAAATTGGC TAAAGATTGG ACGAATAAAG GATTATCAAA TCGCCAAATC GTTGACCAAT 660 

TGAAGAAACA TTTTGCATCA ACTGGCGACA CGTCTTCAGA TGATATATTA AAAGCAATTT 720 

TGAATAATGC CAAAGATAAA AAACAAGCAA TTGAAACGAT TTTAGCAACA CGTATAGAAA 780 

GACAAAAGGC AAAATTACTG GCAGATTTAA TTACTAAAAT AGrAACAGAT CAAAATAAAA 840 

TTTTTAATTT AGTTAAATCG GCATTGAATG GTAAAGCGGA TGATTTATTG AATTTACAAA 900 

20 AGAGACTCAA TCAAACGAAA AAAGATATAG ATTATATTTT ATCACCAATA GTAAATCGTC 960 

GAAGTTTACT AGATCGATTG AATAAAAATG GGAAAACGAC AGATTTAAAT AAGTTAGCAA 1020 

ATTTAATGAA TCAAGGATCA GATTTATTAG ACAGTATTCC AGATATACCC ACACCAAAGC 1080 

CAGAAAaCGt TAACACTTGG TAAAGGTAAT GGATTGTTAA GTGGATTATT AAATGCTGAT 1140 

GGTAATGTAT CTTTGCCTAA AGCGGGGGAA ACGATAAAAG AACATTGGTT GCCGATATCT 1200 

GTAATTGTTG GTGCAATGGG TGTACTAATG ATTTGGTTAT CACGACGCAA TAAGTTGAAA 1260 

AATAAAGCAT AATTATATTG GGGGAAGAGC ATCTATATAT . TTTTTTAAGT ATATAAGACG 1320 

TCTTATTTCC CCTTAATTTA TTGTGAAGTA TATGCAAAAT GCAATGAATA GATTGTCCAT 1380 

CATTTTAACG TTATAATGAA TTTAACGACT TAGAACTACA CAAGTAAAGG AGAATGAAGA 1440 

TGTCTCGAAA AACGGCGCTA TTAGTTTTGG ATATGCAAGA AGGTATAGCG AGTAGTGTAC 1500 

CTAGAATAAA AAATATTATT AAAGCGAATC AGAGAGCAAT TGAAGCAGCA AGACAACATC 1560 

40 GAATACCAGT CATTTTCATA CGTTTAGTGT TAGATAAGCA TTTTAATGAT GTCTCCTCGA 1620 

GTAATAAAGT GTTTTCAACA ATTAAAGCTC AAGGATATGC GATTACTGAA GCAGATGCAT 1680 

CTACACGAAT ACTTGAAGAT TTAGCACCAC TAGAAGATGA GCCGATTATT TCTAAGCGAC 174 0 

45 GCTTTAGCGC ATTTACAGGT AGTTACTTGG AAGTTTATTT ACGTGCAAAT GATATTAATC 1800 

ATTTAGTATT AACGGGTGTC TCTACAAGTG GAGCTGTATT GAGCACGGCA TTAGAAAGTG 1860 

TAGATAAAGA CTATTATATT ACTGTTTTAG AAGATGCTGT TGGTGATAGA TCAGATGATA 1920 

SO 

AACATGACTT TATTATTGAA CAAATTTTAT CACGCTCATG TGACATTGAA TCCGTAGAGT 1980 

CATGGAAAAG TAGTTTATAG TTAATATAAC GTCAATTAAA GCTCGGCAGT AATGTTTGAG 2040 
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GAGGAACATT TGAACATAAA ATAATATATT TATATAAAAC GACCgAGGCG TTCGAACTGA 2160 

ATGtCCTCGG GTTTAATTGA ATAGAAATCG GACTTATGAA CGAAATATGT TTAAGTCGAA 2220 

5 

CTCCTTGTTT ATACTTATAA ATTTTACGGG TTTAATATAA TACTTATTTA CCTGTAATAT 2280 

ATGCATAATT nCTTCAGTCG GTCAGCCTGT CGTTGCATAG TTCCTATGCA GCAAATGCAT 2340 

ATCCTAATCC TTTAACATTG GCATTnCTGC AAATGAACGC ATAGAATCCA TTCACTGTTA 24 00 

10 

ACTTTTTnCA ACAAATGTCT nACATG 2426 
(2) INFORMATION FOR SEQ ID NO: 543: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1874 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

20 



(xij SEQUENCE DESCRIPTION: SEQ ID NO: 543: 



25 



30 



35 



40 



GAGTTGGGGA 


ATGTGCTCAA 


AATATGCGGA 


CTTTATGCAT 


TyCGGAATTG 


sCCaATTGCA 


60 


GCTTTAAGCT 


ATGGTCAAAA 


AAAGAGGGTC 


ACTATAGCAT 


CTGTTTTAGT 


CTTAAATCCG 


120 


GAAATAATCA 


TATTGGATGA 


ACCGACTGCT 


GGTCAAGATT 


TCTATCATTA 


TAATGAGATA 


180 


ATGTCATTTT 


TAATTGAACT 


AAACAGACAG 


GGGAAGACGA 


TTATTATGAT 


TACGCATGAT 


240 


ATGCATTTAT 


TGTCTGAGTA 


TAGTTCAAGA 


ACAGTTGTAT 


TATCAAAAGG 


TCAAGTCGTT 


300 


GCTGATACCA 


CGCCAgTATT 


GGTTTTAAAT 


GATAAAAAAA 


TCTGTGAGAT 


TGCATCATTG 


360 


AGACAAACAT 


CGCTATTTGA 


AATGGCCGAA 


TATATAGGGA 


TTAGCGAGCC 


ACAGAAATTA 


420 


GTACAATTAT 


TTATTAACCA 


TGATAGGAAG 


GTGAGACGcC 


AATGAATCAA 


TATAATACTA 


480 


TAGGTTTTCA 


CCCGGGAAAT 


AGTCGTATTC 


ATCAATTAAA 


TGCGACTGTT 


AAACTTTTAT 


540 


TCTTATTAGT 


TGTTTCTATT 


TCTGCAATGG 


TGACTTATGA 


CACAAGATAT 


TTAATTTTAA 


600 


TTAGTGCTTC 


ATCTATTTTA 


TTGGTCAAAT 


ATGCTCATAT 


TGAATGGAAA 


CAAGTTCGCT 


660 


TTGTTGTTAA 


ATTCATTCTG 


TTTTTCACAA 


TAtTAAATAT 


TATTGCCGTG 


TACATATTTG 


720 


ACCCTGAATA 


TGGTGTGAAG 


ATTTATAATC 


AGCGTACAGA 


GTTAGTCAAT 


GGTATTGGTC 


780 


GATTTACGCT 


AACATCACAG 


GAATTATTCT 


ATCTTTTTAA 


TCTAATATTA 


AAATATATTA 


840 


GTACAGTTCC 


TTTAGCGTTA 


ATATTTTTAT 


TCACAACGAA 


TCCGAGTCAT 


TTTGCTGCAA 


900 


GTTTAAATCA 


GCTAGGTGTG 


AATTATAAAA 


TCAGTTACGC 


AGTCTCACTA 


GCATTAAGGT 


960 


ATATTCCAGA 


TATTCAAGAA 


ACATATTttA 


ATATTTCACA 


AGCGCAACAA 


GCAAGAGGAT 


. 1020 
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5 



10 



15 



20 



TAPCTTTAAT 

x rvw v* x x x *w» x 


ATTTTCrAfiT 
x i x * v» ± n\j x. 


atppa a an ah. 


1 I viAtACTAT 


TAGTACTGCT 


T\ mp/* 1 TV /*— 1—1*TV IV 

ATGGAGTTAA 


1X40 


GACAATTCGG 


ACAGTATAAA 


APPAPAAPPT 


v7Vj IALu 1 LAA 


AAAACAATTA 


AAAAAAGATG 


1200 


ATTATGTTGT 


TTTGTGTn Tfi 


APPTTA ATAP 
/\v_vj 1 l/UilAL 


1 1L 1 \ j A I ta I I 


AGTAGTTACA 


TTATTCTTTT 


1260 


TAAATAATAG 


TCGATATTTP 




A TT A r"T* A T«PO 


ATATAAATAG 


TCTTTAAATA 


1320 


GAAATAGGAG 


GGAGAPATTT 


A ATPATA A AT 
>*-H 1 VjM x AAA 1 


hPrVR ft 7\ o 7v 
nL luAAAuA 1 


TAAATTTAAT 


GATTCCAAGT 


1380 




T AATTP. A A PT 


1 lAiAAlAi 1 


I\jTAGTCATC 


CACAAGCAAA TATATACACT 


1440 


PPPAAAi*V2TT 


TAP ATA BTTP 
1 Al»/\1AA1 1 L. 


f^A A >\ T V T , TV /""• TV 

LftAAl I AvjAvJ 


ACACAACGGT 


GGATTGAAAA atggcgaaac 


1500 


P ATTYJTCP A A P 


A AT ATPA ATT 


TGGTTACTTT 


GTATTGGTAA 


AAAAAATAGA 


TTGTAGTGTT 


1560 


& r P*TY^I r P 21 TTT 
Al A oVj 1 1 1 




ATATCGACAA 


TTAAAGCAAG 


AaACAGTATT 


AAATTTATTT 


1620 


TATAAATTAC 


ATCCAAGTTT 


TGAAGGACAA 


GGGTACGCAT 


gtgaggctat 


TACAGCAATC 


1680 


ACAAATTTTG 


TGAATTATAT 


CGATCAAGAA 


ACAGTAAAAG 


TTATCAGGAC 


AAATAAGTGT 


1740 


AACCAACGTT 


CAATAAATTT 


AGCAGAAAGG 


CTTAAATTCA 


AGCGAGACGA 


TACTATGGAC 


1800 


GACATTATCA 


ATCAAGGAGA 


TATTGTGTTT 


TAAnAATAAA 


ATACTATGAC 


ATTATCTAAA 


1860 


AAATAAAATT 


AAAA 










1874 



(2) INFORMATION FOR SEQ ID NO: 544: 

(i) SEQUENCE CHARACTERISTICS: 
30 (A) CENGTH: 5280 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 

35 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 544: 
TCAACATTTC TAACACCAAT GTGAAAATGA TCTATGTGAT TTGCAATGGC TTGATTTGTA 60 

40 

ATATGTGTGC CTAAATGACC TGTAGCACCT GTTAACATAA TATTCATTCA CTTCATCTCC 120 
TAATCTTTAT ATACATAACA TAATACTTAT TTGATGGTTT TCAAAACATT TGATTTTATA 180 
AAAAATTCTA ATCTGTATTT ATTGTCGACG TGTATAGTAA ATACGTAAAT ATTATTAATG 240 

45 

TTGAAAATGC CGTAATGACG CGTTTTAGTT GATGTGTATC ACTAATATCA TTGAAAATTT 300 
TAATCaGGTA CTACGACAAT ATGATGTCTG TTTTGTGTCT GAAAGTTTTA CAGTTTTTAA 360 
50 AATAAAAATG GTATAAAGTG TGATTTGTAT AAAAAAGAGT CTCGACGGAT AAGAATTGAT 4 20 

TAATAACAGT TAGCATTTTA TTAATTACCT TAACAATGAT TCAAGTTTAG TTAAATGAGG 4 80 

TTTAATTTGA AAGGGGATAG CGCCTCAATA TAATGTAGGT AGATTGTTCA TATTACGTAA 540 

55 
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AAGCAAGTTT AGCATTGGGA ATGTTAGCAA CAGGTGTAAT TACaTCGAAT GTACAATCAG 660 

TACAAGCGAA aGCAGrAGTT AAaCAACAAa GTGAaTCAGA GTTAAAACAC TATTATAATA 720 

AmCCAATTTT AGAGCGTAAA AATGTGACTG GATTTAAATA TACTGATGAG GGTAAACACT 780 

ATTTAGAAGT CACAGTAGGG CAACAGCATT CTCGAATCAC TTTACTTGGA TCTGATAAAG 840 

ATAAATTTAA AGACGGAGAA AACTCAAATA TAGATGTGTT TATCCTTAGA GAAGGTGACA 900 

GTAGACAAGC AACAAATTAC TCAATTGGTG GCGTTACAAA ATCAAATAGT GTGCAGTATA 960 

TTGATTATAT CAATACGCCA ATTTTAGAAA TCAAGAAAGA TAATGAAGAT GTACTTAAAG 1020 

ATTTTTACTA CATTTCAAAA GAAGACATCT CATTAAAAGA ACTTGATTAT AGATTAAGAG 1080 

AACGTGCGAT TAAACAACAC GGCTTGTATT CAAATGGTCT TAAACAAGGT CAAATTACAA 1140 

TTACAATGAA TGATGGCACA ACACATACAA TCGATTTAAG TCAAAAACTT GAAAAAGAAC 1200 

20 GTATGGGTGA GTCAATCGAC GGCACTAAGA TTAATAAAAT TCTAGTAGAA ATGAAATAAT 1260 

ACTTTCTAAC AACAAAGCGC TATGTTGAAT AGTGCTTGTT ATGGAAATAT ATGGAAGTTA 1320 

AGCGACGTAC TGTTGCTTAG CTTCTTTTTT TGAGGGGAAA AGTTACAAAA CTCACACAAA 1380 

CAGTCGCACC ACGCATTATC TTTTGCTTAA ATAGCTTAAT CATATTTTAT GAATAGTTAA 1440 

AAACAGGTTA ATGTGAATAT CCGAATACAG CTCCTATAAT ATGGGTGTAT GATTCAAATT 1500 

ACGTAATAAA ACAATCTAAT TATAATAGAT TGGAGCATAC AACTATGAAA ATGAAAAATA 1560 

TTGCAAAAAT AAGTTTGTTA TTAGGAATAT TAGCAACAGG TGTAAACACT ACAACGGAAA 1620 

AACCAGTTCA TGCCGAAAAG AAACCTATTG TAATAAGTGa AAATAGCAAA AAATTAAAAG 1680 

55 CTTATTATAA TCAACCTAGT ATTGAATATA AAAATGTGAC AGGTTATATC AGTTTCATTC 1740 

AACCAAGTAT TAAATTTATG AATATCATAG ATGGTAATTC TGTTAATAAT ATTGCTTTAA 1800 

TTGGCAAAGA TAAGCAACAT TATCATACGG GTGTACATCG TAATCTTAAT ATATTTTACG 1860 

40 TTAATGAGGA TAAGAGATTT GAAGGTGCAA AGTACTCTAT TGGGGGTATC ACGAGTGCAA 1920 

ACGrTaAAGC TGTCGACCTA ATAGCAGAAG CAAGAGTTAT TAAAGAAGAT GATACTGGTG 1980 

AATATGATTA TGACTTTTTC CCATTTAAAA TAGATAAAGA AGCGATGTCA TTGAAAGAGA 2040 

TTGATTTTAA ATTAAGAAAA TACCTTATTG ATAATTATGG TCTTTACGGT GAAATGAGTA 2100 

CAGGAAAAAT TACAGTCAAA AAGAAATACT ATGGAAAGTA TACATTTGAA TTGGATAAAA 2160 

AGTTACAAGA AGACCGTATG TCCGATGTTA TCAATGTCAC AGATATTGAT AGAATTGAAA 2220 

TCAAAGTTAT AAAAGCATAA CACATATACT TGATGACGAA ATAAGTTGAA ATTGAAATAG 2280 

AGAGGTTAAG TGACGATCAA ACGTTGCTTA ACTTCTTTTT AATGCTTAAA AATTATTTCA 2340 
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TTAATAATAC TTCAATAATT GTTAAAAGGG 
ATAATGATGT TGTATGATTC AAATTACGTA 
5 GCATACAATT ATGAAAATGA GAACAATTGC 

AACAGGCGCA ATTACAGTAA CGACGCAATC 
AGTTGACAAA GTACCAACGC TTAAAGCAGA 

10 

TGCAAATTCA GCGACAACAC AAGCAGCTAA 
AAAGGCACCA AATACTAATG AGGAAAAAAC 

15 ACCTAAACAA GAAGAGCAGA AAACGCTTAA 
ACAATCACAA ACGACAACCG AATCCACAAC 
AACAAACACG CCACAACCAA TGCAATCTAC 

20 AAAACAAGCA CAAACAGATA TGACTCCTAA 
ACCGAGTTTT GAATTTGAAA AGCAGTTTGG 
GTTTATGAAT GTTATTCCAA ATAGGTTCAT 

25 

GAAAAAATAT AAAGATGGAC CTTACGATAA 
TAAATATCAA TTGAAAAAAT ATTCTGTCGG 
TAATCACAAA GTAGAATTAA GCATTACTAA 

30 

TGTTTCAGAA TACATGATTA CTAAGGAAGA 

GAGAAAACAA CTTATTGAAA AACATAATCT 

35 TATTAAAATG AAAAACGGTG GGAAATATAC 

TCGTATGGCA GACGTCATAG ATGGCACTAA 

ATCATGACAT TCTCTAAATA GAAGCTGTCA 
40 

TTTACATGTT GCTTAGCTTC TTTTATTATG 
TGTTTGTAAA AGTGGCATTT CTATGTCTTA 
TTGAATCACA TCAAAATCAT TTTTATTTAA 

45 

CGATGATTCA AATATAGTTA AACAAGGTTT 
TAAAGCTGTA TGATTCAATG AATGTAATCG 
so CAACTATGAA AATAACAACG ATTGCTAAAA 
GTGTAATCAC AACGACAACG CAAGCAGCAA 
AAGCACCACA ATCAACACCG CCCTCAACTA 

55 



GTTTAATGTG ATTATCTTAG AACGCCATCT 2460 

AAAAGACAAT CGAATATAAT ATAGATTGGA 2520 

TAAAACCAGT TTAGCACTAG GGCTTTTAAC 2580 

GGTCAAAGCA GAAAAAATAC AATCAACTAA 2640 

GCGaTTAGCA ATGATAAACA TAACAGCAGG 2700 

CACAAGACAA GAACGCACGC CTAAACTCGA 2760 

CTCAGCTTCC AAAATAGAAA AAATATCACA 2820 

TATATCAGCA ACGCCAGCGC CTAAACAAGA 2880 

GCCGAAAACT AAAGTGACAA CACCTCCATC 2940 

TAAATCAGAC ACACCACAAT CTCCAACCAT 3000 

ATATGAAGAT TTAAGAGCGT ATTATACAAA 3060 

ATTTATGCTC AAACCATGGA CGACGGTTAG 3120 

CTATAAAATA GCTTTAGTTG GAAAAGATGA 3180 

TATCGATGTA TTTATCGTTT TAGAAGACAA 3240 

TGGCATCACG AAGACTAATA GTAAAAAAGT 3300 

AAAAG ATAAT CAAGGTATGA TTTCACGCGA 3360 

GATTTCCTTG AAAGAGCTTG ATTTTAAATT 3420 

TTACGGTAAC ATGGGTTCAG GAACAATCGT 34 80 

GTTTGAATTA CACAAAAAAC TGCAAGAGCA 3540 

TATTGATAAC ATTGAAGTGA ATATAAAATA 3600 

TCGGAAAAAC AAGAAGTTAA GTGACAACGG 3660 

CGTAATGATG TAAAAAGACG AATATTCATT 3720 

AAAGTGACGA AACTTCAAAT GTGCCAAGTG 3780 

CGAACATTAT GGATTTCTTA ATTTACTTAA 3840 

AATGTGAATG GAGCAATACG CCATCTATAA 3900 

AACAAATCTA ATAATTACGA ATGGAGCATA 3960 

CAAGTTTAGC ACTAGGCCTT TTAACAACAG 4020 

ACGCGACAAC ACTATCTTCC ACTAAAGTGG 4080 

AAATAGAAGC ACCGCAATCA AAACCAAACG 4140 
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CGCCTTCAAC TAAAGTGACA ACACCTCCAT CAACAAACAC 
CTAAATCAGA CACACCACAA TCGCCAACCA CAAAACAAGT 

5 AATTTAAAGA TTTAAGAGCG TATTATACGA AACCAAGTTT 

GTATTATTTT AAAAAAATGG ACGACAATAA GATTTATGAA 
TATATAAAAT TGCTTTAGTT GGTAAAGATG ATAAAAAATA 
ATGTCGATGT ATTTGTCGTT TTAGAAGAAA ATAATTACAA 
GTGGTATCAC AAAGAGTAAT AGTAAAAAAG TTGATCACAA 

15 AGGAAGATAA TAAAGGTACA ATCTCTCATG ATGTTTCAGA 
AGATTTCCTT GAAAGAACTT G ATTTTAAAT TGAGAAAACA 
TGTACGGTAA CGTTGGTTCA GGTAAAATTG TTATTAAAAT 

20 CGTTTGAATT GCACAAAAAA TTACAAGAAA ATCGCATGGC 
ATATTGATAA CATTGAAGTG AATATAAAAT AATCATGACA 
ATCGGAAAAA CAAGAAGTTA AGTGACAACG GCCTACATGT 

25 GTTCGATGAT TTGAGAACCC GAATTTTCGA TGGGTCCAAA 
AATTTATCTG TAAATCCCTA TCTATCGGGT GTGAAGCACA 
CGAACATTAT AGATTCCTTA ATTTACTTAA TAATGATTCA 

30 

AATGTGAAAG GTCAAATACG CTAACTATAA TAAAGCTGTA 
AACAAATCTA ATAATTACGA ATGGAGCATA CAACTATGAA 
35 (2) INFORMATION FOR SEQ ID NO: 545: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 886 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
40 (D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 545: 

45 



SO 



AGTAAAATTG CCGGTATGAT GGACACAAAC GGTGACCTTG GTCAAGGTGA 


ATTAGCGATT 


60 


AATCCACCtA AATCAGATTT gAACGAATTA CCTTGGGCTA CACGTAAAAA 


TAAACAGCCA 


120 


GCTTCATCCG AAAAAgGTTC AAGTGGTCAT CATGGTAATG CAGCAATGCC 


TCAAACCAmA 


180 


TTAGATTATC AAATATCTAT TGATAAGGTC GTTGAACAGG CGCAAAAAGC 


TGGTATTAAA 


240 


AAGCCGTTTT CAATCGTATA TCCAAGTGAT AAAAATGGTA CCTTTATTGT 


ATCTAATACT 


300 
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GCCACAACCA ATGCAATCTA 4260 

ACCAACAGAA ATAAATCCTA 4320 

AGAATTTAAA AATGAGATTG 4380 

TGTTGTCCCA GATTATTTCA 4440 

TGGTGAAGGA GTACATAGGA 4500 

TCTGGAAAAA TATTCTGTCG 4560 

AGCAGGAGTA AGAATTACTA 4620 

ATTCAAGATT ACTAAAGAAC 4680 

ACTTATTGAA AAAAATAATC 4740 

GAAAAACGGT GGAAAGTACA 4800 

AGATGTCATA GATGGCACTA 4860 

TTCTCTAAAT AGAAGCTGTC 4920 

TGCTTAGCTT CTTTTGTTAT 4980 

TATGACGTGG AAGAGACCTG 5040 

ACGGGATCAG TTTTATTTAA 5100 

ATGATTATTA AACATGGTTT 5160 

TGATTCAATA GACGTAAGCG 5220 

AATGACAGCA ATTGCGAAAG 5280 
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GATCAATATA GCGGTAAAAA GCTAGGTACG ATTAAATATG ATGACTACGG TATTATTGCT 420 

AAATGGTTTA CATGGGGCAT TCCGCTTCAC GAAGGTCATT TATTCGGCAT TTTAAATAAA 480 

5 ATCATTAATT TATTTGTATG TATCGCTTTA TTAGTAGCCA TTGGCATGGG GTTTGTCTCT 540 

TGGATAAAGC GTACAAAAAA TACTGCAGTA AAAGTACCAC ATCGCGTAAA AAAACCAGCA 600 

TCTATATCAC TCATAATATG TTTAATTGTA TTAGGATTAT TAATGCCATT ATTTGGATTA 660 

10 

TCACTTATCC TTGTATTTAT AATTGAATTA ATATTATATA TTAAAGATCG TCGTGCTAAA 720 

CAATAATGCA CTTAAAGTTT TGAACTGACG AAATTTACAA AATGgATTCT CGTCTCTCTA 780 

1S ATTACtTAAA ACGGGgTtCy AaTAATAAAT CgTACTGaTG GgAAAGTTTT TACTTTTTAt 840 

CTGtCCGAtT TTTTnGAAwT TGAAGATAAA AAAGCATCTA AAACGC 886 
(2) INFORMATION FOR SEQ ID NO: 546: 

20 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4336 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

25 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 546: 



30 


GGCATTTGTG 


TCCTTATATA 


AGGAACTGTG 


tTAAATACAT 


TACTGTTGTT 


AAGTTGTTTT 


60 


TGTAATTCAA 


AGAGCAGAAC 


AGAGTAACAT 


CATCAGTTGT 


AGTAAACGAT 


AATCCGGTAA 


120 




AACAACTAAA 


TGAAATAATG 


AAAGTCATTT 


AACCTGAACA 


TTAAAATATA 


TTTGTTTTTC 


180 


35 


ATTAAGAATA 


ATTCAAGTAT 


ATTTAAATCG 


AGGTTAATTA 


TCGTATGAAA 


CGATGCACGT 


240 




TATAATAAAA 


ATGTATGATT 


CAAATTACGT 


AATGAAAACA 


ATCCAATATA 


TTAAGATTGG 


300 




AGCAAATAAA 


TATGAAATTT 


ACAGCATTAG 


CAAAAGCGAC 


ATTAGCTTTA 


GG AATTTTAA 


360 


40 


CAACAGGAAC 


TTTAACAACA 


GAAGTTCATT 


CAGGTCATGC 


AAAACAAAAT 


CAAAAGTCAG 


420 




TAAATAAACA 


TGACAAGGAA 


GCATTATACC 


GATACTACAC 


TGGAAAGACT 


ATGGAAATGA 


480 


45 


AAAATATTAG 


TGCTTTGAAA 


CATGGTAAAA 


ACAACTTACG 


TTTTAAGTTT 


AGAGGTATTA 


540 


AGATTCAAGT 


TTTACTGCCT 


GGAAATGATA 


AAAGTAAATT 


TCAACAGCGT 


AGTTATGAGG 


600 




GGTTAGATGT 


TTTCTTTGTT 


CAAGAAAAAA 


GAGATAAGCA 


CGATATATTT 


TATACTGTTG 


660 


50 


GTGGTGTAAT 


ACAGAATAAT 


AAAACATCTG 


GAGTTGTCAG 


TGCACCAATA TTAAATATTT 


720 




CAAAAGAAAA 


GGGTGAAGAT 


GCTTTTGTGA 


AAGGTTACCC 


TTATTACATT 


AAAAAAGAAA 


780 




AAATAACACT 


AAAAGAACTG 


GATTATAAGT 


TGAGAAAGCA 


TCTAATTGAA AAATACGGAC 


840 



55 



1483 



EP0 786 519 A2 



ATAACCTTGA TTTAAGATCT AAATTAAAAT TTAAATATAT GGGGGAAGTC ATAGAAAGCA 960 

AACAAATTAA AGATATTGAA GTTAACTTAA AGTAAATCAT TACGAATAAT TAAAAGTAAT 1020 

5 

TGAAGCGGCT TAACGGTGAA ATGTAAATTG GTGCGCATAG CTTATACAAA AAGGATGCAT 1080 

CAATCGATAT CGTCGTTAAG CCGTTTTGGT TTGTGTGTCA TGAATCCTAT CCCAATCTCC 114 0 

ATAAAGGTAA AATTTCCACC ACCAACATCA AAATTCTCCA CATCGCAACA TAACCAAATG 1200 

10 

TTATAATAAA TCTATTACAC AAAGAGATAA ATTACTTATT CAAAGGCGGA GGAATCACAT 1260 

GTCTATTACT GAAAAACAAC GTCAGCAACA AGCTGAATTA CATAAAAAAT TATGGTCGAT 1320 

,5 TGCGAATGAT TTAAGAGGGA ATATGGATGC GAGTGAATTC CGTAATTACA TTTTAGGCTT 1380 

GATTTTCTAT CGCTTCTTAT CTGAAAAAGC GGAACAAGAA TATGCAGATG CCTTGTCAGG 1440 

TGAAGACATC ACGTATCAAG AAGCATGGGC AGACGAAGAA TACCGTGAAG ACTTAAAAGC 1500 

20 

AGAATTAATT GACCAAGTCG GTTACTTCAT TGAGCCAGAA GATTTATTCA GTGCGATGAT 1560 

TCGTGAAATT GAAACGCAAG ATTTCGATAT CGAACACCTG GCGACGGCAA TTCGTAAAGT 1620 

TGAAACATCA ACATTAGGTG AAGAAAGTGA AAATGACTTT ATCGGTCTGT TCAGCGATAT 1680 

25 

GGATTTGAGT TCAACGCGAC TAGGTAACAA TGTCAAAGAA CGTACTGCTT TAATCTCTAA 1740 

AGTCATGGTT AATCTTGACG ACTTACCATT CGTTCACAGT GACATGGAAA TTGATATGTT 1800 

3Q AGGTGATGCA TATGAATTCC TAATTGGGCG CTTTGCGGCG ACAgCGGGTA AAAAAGCAGG 1860 

CGAGTTCTAT ACACCACAAC AAGTATCTAA GATACTGGCG AAGATTGTCA CAGACGGTAA 1920 

AGATAAATTA CGTCACGTGT ATGACCCAAC ATGTGGTTCA GGTTCACTGT TGTTACGTGT 1980 

35 TGGTAAAGAA ACACAAGTGT ATCGTTATTT CGGTCAAGAA CGTAACAATA CTACATACAA 204 0 

CTTAGCACGC ATGAATATGT TATTACATGA TGTGCGTTAT GAGAACTTCG ATATCCGTAA 2100 

TGATGACACA TTGGAAAACC CAGCCTTTTT AGGCAATACA TTTGATGCGG TTATTGCGAA 2160 

40 

CCCACCGTAT AGTGCGAAAT GGACTGCAGA TTCAAAGTTT GAAAATGACG AACGATTCAG 2220 

TGGTTACGGC AAACTTGCGC CTAAGTCTAA AGCAGACTTT GCCTTTATTC AACACATGGT 2280 

ACATTACCTA GACGATGAAG GTACCATGGC CGTTGTACTC CCACATGGTG TATTATTCCG 2340 

45 

AGGTGCTGCA GAAGGTGTCA TTCGTCGTTA TTTAATTGAA GAAAAGAACT ACTTAGAAGC 2400 

TGTGATTGGT TTGCCAGCGA ATATTTTCTA TGGGACAAGT ATTCCAACAT GTATTTTAGT 24 60 

SO ATTTAAAAAA TGTCGCCAAC AAGACGACAA CGTACTATTT ATCGATGCAT CCAATGATTT 2520 

TGAAAAAGGA AAAAATCAAA ATCATTTAAG CGATGCCCAA GTCGAACGTA TTATAGACAC 2580 

ATATAAGCGT AAGGAAACAA TTGATAAATA TAGCTACAGC GCGACACTAC AAGAGATTGC 2640 
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10 



15 



20 



25 



30 



35. 



40 



45 



50 



GATTGATTTA GATCAAGTCC AACAAGATTT GAAAAATATC GATAAAGAAA TCGCAGAAAT 2760 

TGAGCAAGAA ATCAATGCAT ACCTGAAAGA ACTTGGGGTG TTGAAAGATG AGTAATACAC 2B20 

AAAAGAAAAA TGTGCCAGAA TTGAGGTTCC CAGGGTTTGA AGGCGAATGG GAAGAGAAGC 2880 

AGTTAGGGGA TCTTACAGAT AGAGTAATTA GGAAAAATAA AAACTTAGAA TCGAAAAAGC 2940 

CTTTAACAAT ATCCGGACAG TTAGGTTTAA TTGATCAAAC AGAATATTTT AGTAAATCAG 3000 

TTTCGTCGAA AAATCTAGAA AATTATACAC TAATAAAGAA TGGAGAATTC GCGTATAACA 3060 

AAAGTTATTC TAATGGATAC CCATTAGGGG CTATTAAAAG ATTAACTAGA TATGATAGTG 3120 

GTGTATTGTC CTCTTTCTAT ATTTGTTTTT CTATTAAAAG TGAAATGTCT AAAGACTTCA 3180 

TGGAAGCATA TTTTGATTCG ACACACTGGT ATAGAGAAGT TTCTGGAATT GCAGTTGAGG 3240 

GTGCAAGAAA TCACGGATTA TTAAATGTTT CTGTGAATGA TTTTTTTACT ATTCTAATTA 3300 

AATATCCAAG TTTAGAAGAA CAGCAAAAAA TAGGCAAGTT CTTCAGCAAA CTCGACCGAC 3360 

AAATTGAATT AGAAGAACAA AAGCTTGAAT TACTTCAACA ACAGAAAAAA GGCTATATGC 3420 

AGAAAATTTT CTCACAGGAA CTGCGATTCA AAGATGAGAA TGGTGAAGAT TATCCAGATT 34 80 

GGGAAAATAG CAAAATAGAA AAATATTTAA AAGAGAGAAA CGAACGTTCT GACAAAGGGC 3540 

AAATGCTTTC AGTAACTATA AATAGTGGCA TTATAAAATT TAGTGAATTG GATAGAAAAG 3600 

ATAATTCAAG TAAAGATAAA AGTAATTATA AAGTAGTTAG GAAAAATGAT ATTGCATATA 3660 

ATTCTATGAG AATGTGGCAA GGGGCTAGTG GTAAATCAAA TTATAATGGG ATTGTTAGCC 3720 

CTGCATATAC TGTGCTTTAT CCAACACAAA ATACTAGCTC ATTATTTATT GGATATAAGT 3780 

TTAAAACACA TAGAATGATT CATAAATTTA AAATTAATTC ACAAGGATTA ACATCAGATA 3840 

CATGGAACTT AAAATATAAA CAATTAmAAA ATATAAATAT AGATATACCT GTATTGGAGG 3900 

AACAAGAAAA GATAGGTGAT TTCTTTAAAA AAATGGATAT ATTGATAAGT AAACAGAAAA 3960 

TGAAAATTGA AATATTAGAA AAAGAGAAAC AATCCTTTTT ACAAAAAATG TTCTTATAAC 4020 

TTTGATAAAT ACATAGATTG CATAAGAATA AAATTTGTAT AATTTAACAT AAAAGTTGTA 4080 

AAAGTAAAGT GAATTAAAAA CGAACATTAA ATTTAGGCAC TGTGAAAGCG CAGTGTCTTT 4140 

TTTGTGTCGA AATTGTGTAC AGAATAAGTA GTTAAATAAA GATTAAGTTG AGATAAAGTG 4200 

TTATTCGTAA ATAAAAGAGA GTAGATCGAT AGGAATTGAA TGATATTAGT TAACTATTTA 4 260 

TTAAATTACT TAATAATGAT TAATTTTTAG TTAAAGTAAG TTTAATGTGA AGCACGACCA 4320 

TTGCTCATTA TAATGA 4336 
(2) INFORMATION FOR SEQ ID NO: 547: 
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(A) LENGTH: 4 87 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 547: 

TAAGCTATCT GAGATAATTG CTGATAACAT TAAACCGGCA ATTTCAGGTT TAATTTCAAA 60 

GCCACGTTCT CTAAACATTT TGTATAAAAT TGTAGCTGTA CAACCAACTG GTTCAGCACG 120 

ATAACATAAA GGACCAGCAG TTTCGAAATT TGCAATTCTG TGATGATCAA TTACATGCTT 1B0 

AATTGTAGCA GAGGCAATCG TATCAGAACT TTGTTGGaAT TCGTTATGAT CAACTAAGAT 240 

AACATCTTGA CCATCTAAAT CATCTGTTAA TAATTCCGGA GCAGGTACAT TAAATGTATC 300 

TAACGCGAAT TGAGTTTCTG CACTCACATC ACCTAAACGG TATGCTTTGG CTCCTGAATT 360 

ACCTCGAAGT TGTTCaAATT CTGCCaTAAT AATCGCAGAT GAAATTGCAT CAGTGkCTGG 420 

aTTCTTATGT CCGAAAATAT ATGTTTTAGC CAnTGTCAAA TATCTCCCTT GTAAATTGTA 4 80 

25 TTCTTTA 4 87 

(2) INFORMATION FOR SEQ ID NO: 548: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 871 base pairs 
30 (B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



10 
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<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 548: 



TTGGTGGTGC 


AGCAGTTATA 


GCAATTGTTT 


TAGCATTCAT 


TGGTAAGTTC ACTGCATTAA 


60 


TTTCTTCTAT 


ACCTACmCCA 


GTTATGGGAG 


GAGTATCTAT 


ATTACTTTTC GGTATTATTG 


120 


CAGCAAGTGG 


CTTAAGAATG 


TTAGTTGAAA 


GCAAAGTAGA 


TTTTGCGAAC AATCGAAATT 


180 


TAGTTATAGC 


TTCTGTAATT 


TTAGTTGTAG 


GTATCGGTAA 


TTTAGTATTT AACTTAAAAG 


240 


AAATTGGTAT 


CAACCTTCAA ATTGAGGGGA 


TGGCATTAGC 


TGCACTTTCA GGAATTATTT 


300 


TGAACTTAAT 


CTTACCTAAA 


GAGAAAAAAC 


AAAACAATTA 


AGATTTACAA ATTAAGGAGG 


360 


GCGCTTTTAT 


GAATCATTTA 


TTATCAATGG 


AACATTTATC 


TACAGATCAA ATATACAAAC 


420 


TTATCCAAAA 


GGCAAGTCAA 


TTTAAATCTG 


GTGAACGTCA 


ACTACCAAAC TTTGAAGGGA 


480 


AaTATGTCGC 


AAATTTATTC 


TTTGAAAATT 


CTACTCGrAC 


AAAATGTAGT TTTGAAATGG 


540 


CAGAACTTAA 


GCTAGGGTTA AAAACGATTA 


GCTTTGAAAC 


ATCAACATCA TCTGTTTCAA 


600 
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TCATTAGACA TCCGTTTAAT AACTACTATG AAAAATTAGC GAATATTAAC ATCCCAATTG 



720 



CGAATGCTGG TGATGGTAGT GGACAACATC CAACACAAAG TTTACTTGAT TTAATGACGA 



780 



TATATGAAGA ATATGGATAT TTTGAAGGCT TGAATGTATT GATTTGTGGA GAcATTaAAA 



840 



ATTCACGTGT CGCACtAGTA ATTACCAnAG T 



871 



10 



15 



20 



2$ 



30 



35 



40 



45 



50 



(2) INFORMATION FOR SEQ ID NO: 549: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 400 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 549: 

TCAATCTAAT ATATACTTCA TGACTTCCCG CCAAAGGCGC AATCGTAGGA TTAGTCTGTT 60 

TATCGATAAG ATCTATTAAT ATTGTTTCTA CTTTAGATTC ACCTATTCCC GCAAATCTTA 120 

ATAGTTCAGA ATGTATAATT CGATTATGGT TTATAAAATG TGACAACAAT TCATTTTTCA 180 

CCATTGGTTG CATTTCTTTC GGTGGACCTG GTAATAAAAT AATTTGTTTG TTTTCAAAAT 240 

TCACCATCAT TCCTGGAGCC ATGCCATGAT GATTTGTTAA TACAGTTGAA CCTTCAATTA 300 

CTAAAGCCTG TTGTcTATTA TTAGGTGTCA TTTCTtGTCC TTGTTCCTCA aAAwAGCTTT 360 

CAATATATTG AAAGAAGGCT CATCAATAAC TAAATCTnTA 400 
(2) INFORMATION FOR SEQ ID NO: 550: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1523 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 550: 



ATACCTCCAG 


CTAGAATACC 


AGCGTATTTC 


ATAAAATACT 


TCCTCCATTC AACTATATCT 


60 


ATATTTAATT 


ATTTAAATTT 


CGTTGCATTT 


TCCAATTGAA 


AACTCATTTT AAAATCAAAA 


120 


CTCTAAATGT 


CTGTGTATTA 


CTTAAAATTA 


TACATATTTT 


GCTTATATTT TAGCATATTT 


180 


TGTTTAAACC 


TATATTACAT 


TATATCAGAC 


GTTTTCATAC 


ACAAATAATA ACATACAAGC 


240 


AAACATTTCG 


TTTATTATTT 


ATATCACTTA 


ACTAATTAAT 


TTATAATTTT TTATTGTTTT 


300 


TAAGTTATCA 


CTTAAAAATC 


GTTTGGCaAA 


TTCGTTGTGA 


CGCTTGTCCA TCTTCTAATG 


360 
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TTTGTTTTAA TGCATCAATG AGTGCTGTTT GATTTTCAAC AATTGGACCT GGCAACTCTT 480 

TTTTATAATC CATGTAAAAA CCTCTAAGCT CATCGCCATA TTTATCTAAG TCATATGCAT 540 

5 

AGAAAATTTG CGGACGCTTT AATACACCGA AGTCGAACAT GACAGATGAG TAGTCGGTAA 600 

CTAACGCATC GCTGATTAAG TATAAATCCG AAATGTCTTC ATAAt CTGAA ACGTCTTTCA 660 

CAAAATCATC ATGTTCATCA ATACGTGTCA CAACTAAATA ATGCATGCGT AAkAAAATAA 720 

10 

CATArTCATC ATCCAGCGCT TGACGCAAAG CTTCTATATC AAAGTTAACA TTAAATTGAT 780 

ATGAACCTTC TCGAATCGCT TCATCGTCAC GCCAAGTTGG CGCGTACATA ATCACTTTTT 840 

15 TATCTAATGG AATATTTAAT CTTGTCTTAA TACCATTAAT ATATTCAGTA TCATTGCGTT 900 

TATGTGATAA TTTATCATTT CTTGGATAAC CTGTTTCCAA AATCTTATCT CGACTAACAT 960 

GAAATGCATT TTGAAATATC GATGTCGAAT ATGGATTAGG TGACACTAGA TAATCCCACC 1020 

20 GTTGGCTTTC TTTTTTAAAG CCATCTTGGT AATTTTGAGT ATTTGTTCCT AGCATTTTAA 1080 

CGTTACTAAT ATCCAAACCA ATCTTTTTTA ATGGCGTGCC ATGCCATGTT TGTAAGTACG 1140 

TCGTTCGCGO TGATTTATAT AACCAATCTG GTGTACGTGT GTTAATCATC CwCGCTTTCG 1200 

25 

CTCTTGGCAT CGCTAAAAAC CATTTCATTG AAAACTTTGT AACATATGGT ACATTGTGCT 1260 

GTTGGAATAT GTGTTCATAT CCTTTTTTCA CACCCCATAT TAATTGGGCA TCGCTATGTT 1320 

CAGTTAAGTA TTCATATAAT GCTTTGGGGT TGTCGCTGTA TTGTTTACCA TGAAAGCTTT 1380 

30 

CAAAATAAAT TAGATTCTTG TTTGGCAATT TTGATAGTAA TTTAAAAGTC GTATATATAC 1440 

TATGTTCTAT CAATTTTTTA ATTGTATTTT TAATCATGTC GTACCTCCGA CGTGTTTTTG 1500 

35 TAATTATATT AATATGTATG AGC 1523 

(2) INFORMATION FOR SEQ ID NO: 551: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4 923 base pairs 
40 (B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

45 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 551: 
CAGTAAGAGA TTTTCTTAAT TGAAAATAAT CTTACTGCTT TTTTAAATTT AATTTCGAGA 60 
5Q TTCAATATTA GTTTATCTCA TTGTGGCATT AATTGATAAA ATTGTTTTAA TGTTATAAAT 120 
CAAAGTCtTC TTCAACAATT TCAATGTCTG CATCAGATCT ATGATATGTG AAAAAGCTAA 180 
TTCTTATGCG GTCTAAATGC TCTAAATGGT GTCGATACTC TTCGATGGCT GCAACAATTT 240 
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ATGTGGACAA TAAATCTTTT TTCTGCGGAT TATCTAACTC ATAATCAACA TGTGTCACAT 360 

TATAACGTGC TTTTTTAGAA AGGCTAGCTA AAATTTGCTC GTGAAAAGCA GTTAATGAAT 420 

CTAAATCTAA TTTGATTTGT AATAGGAAAT TGTTATTAAG TAAATATAAG TCGTTTTGAT 4 80 

AACGCGACAA TTTGTTTAAT ACTTCATAAG CTTGTCTAGT CGTCTGAACT ACTTCTCTGA 540 

AAAGTATTTT CTTTCTATTC TGTTGGTGAA TATGTTTTTT TGTAATAGGA CGTTCTTCGC 600 

TATAGTAATC ATAAATTTTC TCTAACTTTT CGACACGTTG TTTTAAATTA TGACTATCTT 660 

GTTTAATATT ATTAAACTCC GTCGTATCAT TTAATACTAA TTTAAACCAC ATAAAAATAT 720 

CTGAGGATAT ATTTAATGAA TTATAGTAAA TTTTTGTTTC AAATTTAGGT GGTAGAAACA 780 

CAAAGTTAAC TAGAGATGAA CTTATGACAC CAATCATTAC AAGTACAAAC CTGTAAAAGG 840 

CGGTAATATA GAAAGAACCG GTATGTTGTC CCATAATGAT TAATGCTGTT ACACTCGCCA 900 

20 AAGTAGCAAC ATGTGCTAAA TTAAATTTAA ATAAAATAGC AATAAGTACT ATGACGGTAA 960 

CACCCATAAT GATAAAATTA TCACTAAAAA TTGTTACCAT TGTAACAGAT AGTATGGCAC 1020 

CTATAATGTT ACCCAATGCT TGATCAGAAA CTGTTTTAAA TGAACGATAA ATACTAGGTT 1080 " 

GCATTGCACA ACAGCACTGA CACCAGCTAA GGCTTTCAGA CCAACATCAT CCGGTAGTAA 1140 

AGAAGCGATA GACATAGCTA AAATAATGGC TATACCAGTT TTAAAAATCC GAGCTCCTAG 1200 

TCTCAAAAAT AATGACGCCC CTTTTAAGTT TATTGAATAT CTAATATTCG TATTCATTAC 1260 

TGTTATACAC TTACTAGTTA CAAAATTCAA GCTTATTTAT AGTTGTTAAA ATAAATCATA 1320 

CATAATACTG ATAGCGATGT AAAACTTTAG TCAGAGATTA AAATAGTATA AATTTGTAAA 13 80 

ATAAAAACTC ACATAGTGAC ATATCAAGTT AAACGTTAAT AGTTAACGAT ATAAAATGAA 1440 

TCTACTATGT GAGCATTTGC TTTATTTTAA TTCAATTAAA AATATACTTC CTTAAAAGTT 1500 

ATTTCATTTG ACTAAAAGCA TAGTCTGCAG CTTTTAAAGT TTGTTTAATA TCTTCTTCTG 1560 

40 TATGTTCAGT TGTTAAGAAC CAAGCTTCAA ACTTAGAAGG TGCTAAATTG ATACCTTGAT 1620 

TTAACATTAA TTTGAAAAAT TTACCGAACG CTTCGCCGTC AGAATGTTCA ACTTGATCAT 1680 

AATGTGTGAC TTTTTCATCT GTAAAGTACA ATGTTAAAGA TCCATAAATA CGATTAATTG 1740 

TAGCTGTGAT ATTATGTTTT TCGATTAATT TAAGTAAACC TTCTTCTAGT TGTTGGCCTA 1800 

AGCTGTCTAA TT TT TCATAA ACACCGTCTT GTTCTAGTAC TTCGAGTAAT GCAATACCTG 1860 

CTTTCATAGA TAACGGGTTA CCAGCCATTG TACCAGCTTG ATATGCAGGT CCTAGAGGTG 1920 

CTACTTGTTC CATAATATCT TGACGTCCAC CATAGCCTCC AATTGGTAAA CCACCGCCAA 1980 

CAATTTTACC AAATGCAGTT AAATCAGGGA TAACACCTAA TAAATCTTGA GCGGCACCGT 2040 
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AAATTTCATT AACCTCTTCT AAAAATCCAG GTTGAGGCAT TACCATTCCA AAGTTACCAA 
CAATTGGTTC TACTAATACT GCGGCAATTT CATCACCCCA AAATTCAATT GCTTCTTTAT 
AGGCGTTAAT ATCATTGAAA GGTACAGTAA TGACTTCACG TGCGACGCTT TCTGGAACAC 
CAGCTGAGTC TGGAGAACCG AGCTGAGATG GGCCGCTACC TGCTGCAACC AATACTAAAT 
CAGAATGGCC ATGATAAGAT CCAGCAAATT TTATAATTTT ATTTCTTTTA GTATATGCAC 
GTGCAACACG AATTGTTGTC ATGACTGCTT CTGTTCCAGA ATTTACAAAG CGAATTTTCT 
CAAGAGATGG AATTGCATCA CGTAATTTTT TGCTGAATTC AATTTCTAAT TCAGTCGGTG 
TACCAAATAA AACACCTTTA GCAGCTTGTT CTTGAATTGC TTTAGTAATA TGAGGATGTG 
CATGCCCCGT AATAATTGGA CCGTATGCTT GAAGGTAATC AATAAATTTA TTGCCATCGA 
CATCATATAA ATATGCACCG TGTCCTTCTT TCATAACAAC AGGTGCACCG CCTCCTACAG 
CTTTATAAGA ACGAGAAGGG GAATTGACAC CGCCTAGAAT ATATTCGTTT GAAAGTTGTT 
GTAAACGTTC ACTTTCACTA AAATTCATTT ATATCAACCT CTTTTAATTT AATATTTTCA 
TCTAATATCG TATCATAAAA TTATTATAAT GAAGAAAAAG GTGATTATAT GTTGCAAAAA 
GGAGAACAAT TTCCAATATT TAAATTAGAA AATCAAGACG GAACTGTCAT TACAAATGAT 
ACATTAAAAG GTAAAAAGGC GATTATATAT TTTTATCCTA GAGATAATAC ACCTACTTGT 
ACCACAGAAG CTTGTGACTT TAGAGACAAT TTAGAAATGT TCAATGATTT AGATGTTGCA 
GTATATGGTA TAAGCGGTGA TTCAAAGAAA AAACACCAAA ATTTTATTGA GAAACACGGA 
TTGAATTTCG ATTTATTAGT AGATGAAGAT TTTAAATTAG CTAAAGAAAt GGCGTATATC 
AGTTAAAAAA ATCATTTGGC AAAGAAAGTA TGGGCATTGT AAGAACGACT TTTATAATAG 
ATGAACAAGG TAAAGTATTA GATGTTATCG AGAAGGTTAA GGTTAAAACA CAAATAGAAG 
AACTTAAAAA CATTTTGGGG TGACATATAT GAAAGTTGTT GGGTTAAATC GTATGCGTGA 
AGTTGAAACT GAATTACAAC AACGCTTTTC AGATTTAGAT TTTAAATTTT ATAAAAAAGC 
ATCAGAAATA CCTGAGAGCG ACTTGGCTGA TTTAGATATA TTAGTTGGTT ATGATGGCGG 
TATCAATGAG GCATTTTTAC GACGTTGCCC GAATTTAAAA TGGATTGCAT GGTTTGCAAC 
GGGTGTAAAT ACATTGCCGT TAGATTATAT TGCAGATCAC GGCATACTTT TAACTAATGG 
AAAAGGTGTT CAAGCTAAAC AATTATCTGA AT ACATTTTA GCTTTCATTT TAGATGATTA 
TAAAAAGATG AAACTATCAT ATGATAACCA ACGACAACAT ATATATGATT CGAAAATAAC 
TGGTAAACGC CTATCAGGAC AAACAGTTTT ATTTTTAGGT ACAGGTGCAA TTGCTACTAG 
AACTGCGAAG TTAGCAAAGG CTTTTAATAT GAATTTAATT GGTCTGAGCA AGTCAGGTCA 



2160 

2220 

2280 

2340 

2400 

2460 

2520 

2560 

2640 

2700 

2760 

2820 

2880 

2940 

3000 

3060 

3120 

3180 

3240 

3300 

3360 

3420 

3480 

3540 

3600 

3660 

3720 

3780 

3 840 
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TGCTGACATT 


ATTATAAATG. 


CTTTACCAGA 


AACGCAAGAA ACGATTCaTT 


TaCTAAAGAA 


3960 


AAAACATTTT 


GAATTAATGA 


AAGATGAAGC 


ACTTTTTATA AATATAGGAC GAGGTAGCAT 


4020 


AGTTAAAGAA 


GCGCTCTTAA 


TAGAAGfATT 


AAAAAGTAAA GTTATTCGAC ATGCATATTT 


4080 


AGATGTGTTT 


GAAAATGAAC 


CTTTGAAACC 


TAATCATGAA TTATATGAAT TGGATAATGT 


4140 


AACTATAACA 


GCGCATATAA 


CTGGTAATGA 


TTATGAAGCA 


AAGTATGACT 


TATTAGATAT 


4200 


TTTTAAAAAC 


AATCTAGTTA 


ATTTTCTCAA 


TAAGAATGGT 


CTAATTGAGA 


ATGAAGTTGa 


4260 


TGGTAAAAAA 


GGCTATTAAA 


TGArATCATC 


ATGTAAATAT 


TGACACGCGC 


GCAATACTAC 


4320 


AGTTATATTT 


aTAGTAAgTt 


AATaATgATT 


ATATAAGAaA GATGGTgATA TAGATGAGTG 


4380 


TTGAAATAGA 


ATCAATTGAA 


CATGAACTAG 


AAGAATCAAT 


TGCATCATTG 


CGACAAGcAG 


4440 


GC6TAAGAAT 


TACACCTCAA 


AGACAAGCAA 


TATTACGTTa 


TTTaATTTCT 


TCACATACTs 


4500 


ATCCAACAsC 


TGaTGaAATT 


TATCAAGCAC 


TTTCACCTGa 


TTTTCCAAAT 


ATAAGTGTTG 


4560 


CGACAATATA 


TAATAACTTA 


AGAGTGTTTA 


AAGATATTGG 


AATTGTAAAA 


GAATTAACAT 


4620 


ATGGAGACTC 


ATCAAGTCGA 


TTCGACTTTa 


ATACACATAA 


TCATTATCAT 


ATTATATGTG 


4680 


AACAATGTGG 


TAAGATTGTT 


GATTTTCAAT 


ATCCACAGTT 


AAATGAAATT 


GAAAGATTAG 


4740 


CTCAGCATAT 


GACTGACTTT 


GACGTAACAC 


ATCATCGAAT 


GGAAATTTAT 


GGAGTTTGTA 


4800 


AAGAATGCCA 


AGATAAATAA 


TTTAACTTTG 


GTAGTATGAC 


AAATTAAAAA 


AGCGTTACTw 


4860 


ACTTCATATA 


AGTAAGCGTA 


ATATTTAAGA 


nGTTAAACGA 


CATGaAAGTt 


GTTTAACTTT 


4920 


TTT 












4923 



(2) INFORMATION FOR SEQ ID NO: 552: 

(i) SEQUENCE CHARACTERISTICS: 

<A) LENGTH: 917 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 552: 

TCCGGCTTTA AAAACTTTTC CCAATTCCAG CTTGGGCCTT TGGCATTAAT ATTAACCTCC ' 60 

TGGTTCGGAT TAATTGGGAA CCTAACCnTT TAGGCAATAA TTGGTTTAGG CAACTTCCAA 120 

ATTGGTGGTT CAACCAACGT CTTTGGATAC CyTGcTCATT TAATTCTAAA ATGgTyrGAA 180 

CGCATTTTGG TACCCAAAAt GgTGACGTTC GTTTGCACGG TCTAATAAAT TGTCTAAGTT 240 

GTCGATTGGT TTCATTAATT GAaCACCATT TTGCTCTTCA GCAAGACCTT TGTCTACTTT 300 
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GCGATCCATT GTTTGTTCGA AAAGAATAGC ACCCAAAATT TTATCTGGTG AGAATGAAGG 420 

TGAAGTTACC ACACGTGTAC GCATATCGTG AACAAGTTGG AACATTTCGT CTTCATTGCT 480 

ATATTGATCT TCGTTTACAC CATATTCTTT AAGTGCTTTT GGTGTACTAC CACCACTTTG 540 

GTCTAATGCG GCAATAAAGC CTTTTCCATT TTTCATTTTT TCTAATTGCT CTTTATTCAT 600 

ACTTTCCACT CCTTAACTTT TCAATACACC TCCAGTATGA TAAAAATGAG AACATTTCTC 660 

AAGTCATAAA CCTTGAAAAG TGTATAAAAT GTGAAAAATA ATTGTCAGTT TAATTAAAAA 720 

TATTATTTTA TTCTAGGTAT GACTAACGCC ATTAATGACA TAAAGAAAAT ATGTGTAATA 780 

J5 ATCCAACCGA TTAATTCTGT CACACTAAAT TGAAAAATTG GACGTTGCGC AATAAATACT 640 

AAAAAGGGAT ACAATGCTAT AAATAAGAAA AATAAAGGGA TATAACATAG ATAGTAAAGC 900 

CTTTTAGAAG TATGAAA 917 
20 (2) INFORMATION FOR SEQ ID NO: 553: 

<i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 432 base pairs 

(B) TYPE: nucleic acid 
25 (C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



30 



35 



{xi) SEQUENCE DESCRIPTION: SEQ ID NO: 553: 

ACTCCCATAT CCACTGGCAA GATTTATAAT TTGTAATTCT AAAGTATAAT AGCCTATATT 60 

TTTCAAAATC TCTTTTTTTA TGATTAACAT CCCTCTAAGT GCACCTAAAG GTTTTTATGT 120 

AATGTATTAA ATATTTCCAT TTATACATAT ACATCTTGTA TAAAAAGAAA GAACTCCATA 180 

TATACTCAAA AGGTATACTG AAGCTCTATA TATTATATAA AATTATTATA CTATTTTGAA 240 

AAACATAAGT AAATCACTAA ACATGATTTC TTTCACTTTT AGAAAACTTT TAATACTATA 300 

40 AAAGCACCCA CTCAGTCACT AGTTTGGGCA GTTATTGTAT GCCTATTGaA CTCAATGCgT 360 

ATATTACAAT ACCTTTTtCG CATATTCATA TAAGacTTTG CATCTTTAAG CTTAATTGCT 420 

ATCTCTTTCT CT 432 

45 

(2) INFORMATION FOR SEQ ID NO: 55*4: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1374 base pairs 

(B) TYPE: nucleic acid 
50 (C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 
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TTTTGCTTTA TGTTAAATGG ATTATTaTTA GAATAAAAAA TCGGTGATGA GCTAAAAAAG 60 

TGTGTAGGAT GTTTTCCkAA CCCAATTTTT ACATCCGAAG ATATCGAACA ATATCTTCCT 120 

5 ACTTCTACAT TATTAAAATC ACTACCAAAT CCAATATAAC TGTATTCACC AATGTGAGAA 180 

TTCCTGATTT TACACCATCT ATCTATATAG TTATTGCCAT CAAATTTTGA GTTTGTAATA 240 

TACGCCAAGC GATGAATCTT AACATTCGAT TCTTTAGAGG ACTGGTTTTT CAGCAAACCA 300 

10 

ATTATCTTTT CAATCGCTAT CCTCATCGTC ATTTCCTCCA AGTATTTCGA TTGATAATAT 360 

CTTTATAGCT TTGAATAATT TTAACTACCT TTGTCGAAAC GTTAGTGTCT TTATAATCAA 420 

15 TAGCATCAAT CATCGGTTCG TTATTGTTTT GCATCTCTCT TGCTAGTTCA ACGGATTGGA 480 

TTAGATTGTT ATAGGTAATA CCACCTACAA TAACCGTACC TTTATCTAGT ACTTCCGGTC 54 0 

TTTCTGTGGA AGTTCGAATA AGGACACCAG GGAACTTCAA AATAGACGAC TCTTCTGACA 600 

20 ATGTTCCACT ATCTGATAGC ACAACAAATG CATCTTTTTG CAATGCATTA TAATCAAAGA 660 

AACCAAATGG CTTTAACTGT TTAACTAATG GATCAAATTC AAATTTACTT TCTTCAATTT 720 

TCTTCCAACT TCTTGGATGC GTTGAATAAA TCACAGGCAT TTTATACTTT TTGGCAATAT 780 

25 

CATTTATCGC ATTCATTAAT GATTTAAAAT TCTTTTCATT ATCGATATTC TCTTCTCTAT 840 

GCGCAGaTAC TAAAATGTAT TGTTGCGGTT CTAATCCTAG TTTATTTAAA ACGTCACTGT 900 

GATTAATTTT ATCTCGATGC GCTTCTATCA CTTCTGTCAT CGGTGATCCT GTyACAAAGA 960 

30 

TATTCGCTTT ATTGAAGCCT TCATCTAATA AATAACGTCT GCTATGTTCC GTATAAGGTA 1020 
GATTCACATC ACTGACATGG TGAACAATTT TACGATTGAT TTGTTCAGGT ACATTCTGAT 1080 

35 CAAAGCATCT ATTACGCGCT TCCATGTGGA ACACAGGAAT CTTTAATCGT TTAGCAGATA 1140 
CTGCTGCTAA ACAACTATTT GTATCACCAA GAATTAAAAG TGCATCTGGT TGTTCGCGTA 1200 
ATAAAACATC ATATGTCTTC GCAATAATAT TCCCCAtCGT TTCTCCAnGt TACTTCCAAC 1260 

40 TGCCTCTAAG TAGTGGTCCG GTTGTCTTAA TTCCAAATCA TCAAAGAAAA TTTGATTCAA 1320 
TGTATAATCA TAATTTTGAC CAGTGTGTAC TAATATCTGA TTAnAAATAT TGAT 1374 
(2) INFORMATION FOR SEQ ID NO: 555: 

45 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1472 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

50 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 555: 
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TTACCTCTAG 


GCATGTCCCT 


TTCACGGTTT 


GCTTATGATA ACGTTATCGA 


CATTGTTAAA 


120 




TTGTCCTTTT 


TGAAAAAATA 


ATTCTGGTGA GATAGACGCT 


ACTTGGaTTT 


CaTCaGTTTG 


180 


5 


TAAtAACGCA 


GtATAAtTAC 


CaTTACTAAA 


tTGaGTTAAT 


CGTTCaTATA AAGTACTAAT 


240 




AGGATAATAA ATGTTATCCG TTAAgCGCGC CGTATAGTTC ACTTGATACG 


TTTCGCCTTC 


300 


10 


AACAATTGCT 


TGTTGGACAC 


GTTTAATATT 


AGTCATCATA 


ACCTCAGAAG 


ATTCAACAAA 


360 


TGAAAAATGA 


TACTTTGATA 


CATAAGAAGT 


TTGATGTTCA 


TATGTTGAAT 


TTATGCTTTC 


420 




CGCTTTTTCA AAACTATAAG 


CTGCTGCATA 


AATATCATCT 


TTAGCTAATG 


AATGTGTACA 


480 


15 


CATAGCATGA TTAAAATACT 


TTGCCGCTTC 


GTAACTTAAA 


TATAACGAGA 


CATATCTACC 


540 




TTGTCGTkGt 


GCGCTTGTGC 


AAAGTGTATC 


ACTTCTCCCA 


CATCAGCCAA 


CTTAGTAGCA 


600 




ACATACTTCT 


TTATAAATCC 


CTTTAATTGA 


ATATGGTATT 


GCTTATATTC 


ATTTTCAGTT 


660 


20 


AAATAGTAGC 


GATAATTATA 


TTCTATTCTC 


ACAGTAATCA 


CCTACCTTCG 


ATAAAAATAA 


720 




TTCAACTTGT 


CGATAACCGT 


ATTCACTCAA 


AATAGATTCA 


GGATGATATT 


GCACACCAAA 


780 




AACCGGAAAT 


CTAATATGCT 


CAAATGCCAT 


AATAATCGCT 


TCATCGTTTT 


TTGCTGTAAT 


840 


25 


CTTTAAGCAA 


TTTGGAAAAG 


TCGCTCCGTC 


AGCAATTAAT 


GAATGATAAC 


GCATTACATT 


900 




GAAATTTTGA 


GGCAGTCCTT 


GAAAAATACC 


TTCATTGGTA 


TGGCGTAACT 


GTGTAGTATG 


960 


30 


TCCGTGTACA 


GGATGATAGC 


CGTGAATGAT 


ATTTCCACCA 


AAATAAGACA 


CGATACATTG 


1020 


AAATCCTAAA 


CATACACCTA 


GTATAGGTAC 


ACGCTGATAA 


AATTGTTCTA 


ACACTTCATT 


1080 




CAAGATAGGA 


TAATCATCCG 


GaTTACCCGG 


CCCAGGCGAA 


ATAACAATTG 


CTTTTGGCTT 


1140 


35 


CATATTAATG 


ACGTCTTCTA 


TCAGCAGATT 


ATCAATACCA ACAACTTGAA 


CTGTTAGTTT 


1200 




CGTTTGAGTC 


TTAATATAGT 


CTATTAAATT 


ATATGTAAAT 


GaATCATTAT 


TATCTATGAC 


1260 




TAGAATCATT 


GTATACTCCG 


TTCTAAATGT 


GTTTTATTTT 


TATAATATGT 


ATTGGATGTA 


1320 


40 


GCTAAAACTT 


TAAAAGCATT 


GTCATTATCC 


TGACCTTGAT 


TTTAACTAAT 


ATATGGTATA 


1380 




TTCTATTCAT 


CGTACATAAA 


TGAATATCAG 


AGGTTCCTAG 


CTGAAACCCT 


CTATAAAAAA 


1440 




CTAGGCCATT 


GAAATTTCAA 


ACATTCGTTG 


GG 






1472 


45 


(2) INFORMATION FOR SEQ ID NO: 556: 









(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1054 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 
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AGAACAGCAA GGATTACTTA CTGAGGAATT AAAGAAGGAT ATTTTAAAAC AGAACAAATT 60 

ACAACGTGTT GAAGACCTAT ATAGGCCTTT TAAACAAAAG AAAAAGACAA GGGCAACTGA 120 

5 GGCGAAACGT AAAGGGTTAG AGCCATTAGC GATATGGATG AAGGCACGTA AACATGAAGT 180 

CTCAATTGAA GAAAAAGCAC AACAATTTAT AAATGAAGAA GTGCAATCGG TTGAAGATGC 240 

TATCAAAGGT GCACAAGATA TTATTGCGGA ACAAATTTCA GATAATCCTA AATATAGAAC 300 

10 

AAAAATTTTA AAAGATATGT ATCATCAAGG TGTGTTAACT ACATCTAAAA AGAAAAATGC 360 

TGAAGATGAA AAAGGTATTT TTGAAATGTA CTATGCATAT AGTGAGCCAA TTAAACGCAT 420 

/5 TGCTAATCAT AGAGTTTTAG CTGTTAATCG TGGTGAAAAA GAGAAAGTAT TATCTGTAAA 480 

GTTTGAATTC GATACGACAT CAGTAGAGGA TTTCATTGCA CGTCAAGAAA TCAATCATAA 540 

TAATGTAAAT CGCAGTTATA TTTTAGAGGC GATTAAAGAT AGCTTGAAAC GCTTAATTGT 600 

20 CCCTTCGATA GAGCGTGAAA TCCATGCTGA TTTAACTGAA AAAGCTGAAA ATCATGCAAT 660 

AGATGTTTTT AGTGAAAACT TAAGAAATCT ATTACTGCAA CCTCCAATGA AAGGTAAACA 720 

AATATTAGGC GTAGATCCAG CATTTAGAAC AGGTTGTAAA TTAGCAGTCA TTAACCCATT 780 

25 

CGGTACTTTT ATAGCAAAAG GTGTGATTTA TCCGCATCCA CCAGTTTCTA AAAAAGAGGC 840 

AGCAGAGAAG GATTTTGTAC AAATGGTTAA AGCGTATGAT GTGCAATTAA TTGCAATTGG 900 

CAATGGTACT GCAAGTCGTG AAACAGAACA ATTTGTTGCA GATTTAATTA AAAAGCATCA 960 

30 

GTTGCCAGTA CAATTCATCA TTGTCAATGA AGCGGGCGCT TCAGTATACT CAGCATCAGA 1020 

AATTGCTAGA GATGAATTTC CTGATTTTCA AGTG 1054 
35 (2) INFORMATION FOR SEQ ID NO: 557: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1057 base pairs 

(B) TYPE: nucleic acid 
(C> STRANDEDNESS : double 

40 (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 557: 

45 

AAATGTCAGA ATACAAGAAA AAAATAATTG AATTAATTGA AAGTAATTTA ACAGGATATG 60 
AAATTTCTAA AAAAACTGGA GTTTCTCAAT ACGTACTTTC ACAATTAAGA CAGGGCAAAC 120 
GCGAAGTAGA TAATCTAACC CTGAATACAA CAGAAAAATT ATATGAATAT GCCAATAAAG 180 

SO 

TTTTGTAATT TAACTAATGT ATAAATTAAT CAAGCTATGT TTATTTGATT TAACTATTAA 240 
TAAAAATCAT ATGGTGAATG GATATTATAA TAATTAAAAT ACAAAAATAG TAGATTCCAA 300 
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AAGGGAAAAT AAGTGTTAAG TTTTAAATGA TAAAAAAGAT TGGAATGGAT CGTCTTGAAA 420 

TGCTCCCTTC AAAGTTTTCA TTTTTTCAAT GTCGACTTCG AAGGGGGCAT TTTCATTAAA 480 

TTGTTATAGC TTTTTATATT TGTATAATGA ACATATAAGT TTAAGAAGGT GCGAGTGAAG 540 

GAAATAAAAA AGCTCAAATG TACCAAATTG TTAATCTTAA TAAATCTCTA CTTTATAAAG 600 

ATTGAATGGA CATTCGAGCG TTAATCAGTC AGGAGGGACT TTCCCTCCTA CAATTTAATA 660 

ATAATACTTG CTTCACCACT ATACAAGGAG TGAGTTGTTA TGTTCAAAGT GAATTATTCG 720 

ATTTTAAGTT ATTATCCAGA ATATAATATC GCAGTAAGTT GGCAACGTTT AAGAGAAGGA 780 

AAAACAATAA AAAACAAGAT TTAATACTGC TGCGTCATGA GGCGCTTGAA CATTATTTGA 840 

TGAATAAGTA TAATTTCAAC TATGATTATG CACATAAAAT TGTATCAAAA AAATACGATT 900 

ATTCAATTTT TATAAAAaAG AAGGTGGATT AAATGCTTAC ATTAATAAAA TTGGAAAGAA 960 

GATGaACAGG tTATAATATA TGraTATATa CCTGaAGATG aTATAAGTAC CGGGTAAAGG 1020 

GTCCCGTACC TTTTTAATTA AAAAAGTTCC AGGGGGT 1057 
(2) INFORMATION FOR SEQ ID NO: 558: 

■ (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3754 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 558: 

TTTGAGAAGT ATTATGATGG nTGTAGTTAT 60 

TACTAAGTCT ATATTGGTAG GAATATCGAT 120 

TTTTTAATAT GGAGATGTTT GTGACTTTTC 180 

TTTCAAATAA ACTTTGTGTT TAAAATTGAG 240 

ATTGTTGAAG TTATGTGTCT TGTATCCTTA 300 

CTTTCTCTTT ATCTGTGTAG AAAGGATGCT 360 

TTTCTGATaT ATCATATGTr ATTcTACCTG 420 

AATTATCAAC TTTATCATCA AAGTCTATCA 4 80 

GCGTTAATTT GACTAATTTG CCTATGTATG 54 0 

TAATATACGG AACTACATGA AAACCAGTTT .600 

CAATATATTT ACCATTCACA TAAGATTTAC 660 



35 CTGTGCTGTA TTTACtTTAA TTTGACGACA 
TTTATGAAAG TAATGTATTA ACAATCGAAT 
GTTTAGTTTA AATGGAATGC ACTATTTAAG 

40 GATGATTAAG ATTTTTATAG GTGTGCATCA 
CTTAGGAAAT CGATAGGTTT AGATGAGGAT 
GTTGTTATAA AAGCGCAAAA AATAGCACCG 

45 

ATTATTGTAA AACAATAGTT TTAATTTnAT 
TATCAATTTC TATCGAATTA TAACCATCAA 
CTTTTCCAAT TAATATTTTA TTATTAGTAA 

50 

ACTGTAAATT CATATTTAAT CACTCCTTTT 
TAGAATAATG AACCTTACCT AATTTCGTTT 
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AAACTGGAAT ATCAATAAAT TCTTTTTTAG TCATCTTTTC ACTTTCATTA GAATCTATTA 780 

TAGTATAACT TGGTAATAAA GATGAATTAT TTTTCTTATT ATTATATTCA TTTGTGCATA 840 

5 . 

AAATATGACG CTTTTGCTTA ACATTATTCA ATTTCATCGT CATTTTACCA TTACTTATCA 900 

TTTCAAGCAT TTCTTTTTTA GCTTTTTGTA GAAAGGATGC TATTTTGTAA TTATTTTAAT 960 

AATCTAATAC TTTTTATCTC AGTTTCATCA AACGAATAAA CAGCAAAATC AGTCTGTATA 1020 

10 

TCTACAACAA GATTTCCTGT TTCGCTCTCG AATTCATTTT CATAGTCAGT TACAAACCCT 1080 

TCGTATTCTT CATTATTCAA AAGCGTGATA ATAACATCTT TACGATATGC ATCTnCAATT 114 0 

1S CTCAATACTT TTCACCTACT TATCAATATA AGGTACTATA TGaGcACCTG GTCTTCGAAT 1200 

AATGGCACTT CCCTTTCTGG TTTCAATATA CACATTTTCG ATATGTATTT TTCCAATAAT 1260 

TTGATTAAAA TTAATAATCT CTTTCAAATC AAATCGCTCA TCACTTAATA TTAGATTGCC 1320 

20 TGTTGACATT TTTTCTCTTA ACAATTCATT CAATAAATCT ATAGAAAGTA TTGTATAGCT 1380 

AGGCAATTTC TTATTATTT A AAATGGCTCT TTTTTTATTT TCATTATATA GGTGATGACC 144 0 

TAACATATAT CTATTTTATT TTCCGCAATT TATTTCTATT TTTATTTTAC CATTTTTAAT 1500 

25 ■ 

CATTTCTTTC ATCTGGTTTT TAGCTTTTtC CTGtAATTAT GCTTCTTTTA CTTCTACTTG 1560 

ATATTTACCt TCACGCTCTT TAAAGAACTT GTCCCGCCAA TTGCCAACAT GTGGCACTGT 1620 

GGTACTTCTA CACCAAGGAT GCATAGGTGG CGCATTCACA CCTGGTATCA TATCTTTAAC 1680 

30 

TTTAAATATT TTTCCGTTAA GTGAATGACA TAATTTAGAT GTTTTACTAT CTATTTTGGC 1740 

AACATATTTA TATTCGCCAT CTTCACCAAG TTCTTTTAAA TATGTTAACT TTTGTGCTTC 1800 

55 TGCATTTTCA GTAAATAGTT AAAAAAGCGT ATAAAAATAG CACCACTTTC TCTTTAkCTG 1860 

TCTAAAAAGG ATGCTATTTA TCTTTTGAAT TTGAATTCTT TTTCGCTTTT TCTATACTTT 1920 

CAAATTCTTC AACTAATTCT TTAAAAGATT CACTCAATTC TTTTGCAGTT ACATTTCCAT 1980 

40 CTAATTGTGA ATCTAACATA ATTAAAATCA TCTCACTTTA TATTTAATCa TATTTATACT 2040 

ATAAAGTTTT TTCAATAATT TTTCAATATG GCTATCATTA ATGATATTAA TATGCGTAAA 2100 

ATATTTAGCA CAAAATTTAC TCACTATTTT ACCATGAAAC CTATTTGACT TGGTAATAAA 2160 

45 

TTTTACTTGT CCCTTATTAG TAACGATTGT CATTGATTTT ATTGATGGAT GCTTAAAAAA 2220 

TGTAAATAAA TCATATTCTG AAAATCCTGA CTGTCCAGGA TGGTTATGTA ACATAACAAT 2280 

5Q TGAATTCGGT TTACTGTTAA ATAATAATTC GGTTGCTTGT TACCCTGGCA CAAAAGATAC 2340 

ACTATCTTGA TTGACATATA CTTTTGTAAA TTTACCATCT TTTAACAAAT AAGCTACTTC 2400 

ATTGCTATCA TTGTTTTCCA TGAGATATAC CTCCGTTTAT AGtCTGTCGA CTGATATTCC 2460 
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GAAGGTTAAA ATTTTTAAAG TAAACTTTCT TTATCCCCAT GCTACGAGTT CAGATTCAGG 2580 

AAATAGCCCT TTACTAGTAT TTATGTATAT TCTGTCTATG GCATGAATAA AATAATTATC 2640 

5 TCTTGTATTT tTTTCTAAAC TAGATTTTTC AGCATTGATA ACTTCAAGAC TATCTATATC 2700 

CATTTGAATA ATACCAGGCT TAATATTTTC ATCATTATTA GGAAAATATT TATATGTAAC 2760 

ACTTTTATCA TTAATTTCTT TTATTTTTAA TATTAGCAAT CATTTCCACC TCTAATTAAT 2820 

10 

TAAAATACTA TAATTATATT TTATTTCTGT AAGTTTATGT GCCTCTATAT AGTGTAAATT 2880 

ATACTTATTC ATTAGATAGT GTTCAAGAGC TTCATGTTTC TACATTATTA TATCCATTTT 2940 

TTTAATATTT TTCCCTTCTC TTAAACGTTG CCAACTTTGA GCCATATAAA AGTCAGGATC 3000 

15 

AAATTGTTTA AATCCACTTT CTAATAAATA CTTATTTTCA AATATATGTT CATAAACTCT , 3060 

TTGAATTAAA TTTTTATTTA TATTAgTATT TTTAGCAATT TTAGAAATCT CTATCTGTTT 3120 

20 ATCTCGATTT CTAACTGAAT TATAATAAAT TTGAGCATGT CTGTTCCTTT TGATACCGTA 3180 

TTCATCACTT TTATTATTAA GTGCACCTGA TTCAATAAAA CAACCTTCTA CTTGATATTT 3240 

ACCTTCACGC TCTTTAAAGA ACTTGTCTCG CCAATTGCCG ACATGTGGCA CTGTGGTACT 3300 

25 TCTACACCAA GGATGCATAG GTGGCGCATT CACACCTGGT ATCATATCTT TAACTTTAAA 3360 

TATTTTTCCG TTGAGTGAAT GACATAATTT AGATGTTTTA CTATCTATTT TGGCAACATA 3420 

TTTATATTCG CCATCTTCCA CCAAGTTCyT TTAAATATGT TAACTTTTGT GACTCtTCyT 3480 

30 

TTTCAACGAA TAATGAAAAA AGCATATAAA AATAGCATCG CTTTCTCTTT ATCTGTGTAG 3540 

AAAGGATGCT TTAATACCaT GCTATTTTAT AATTTTcGGG AAATTcTTGC TTCTCGATAA 3600 

AGTCTCTTAC TACAGAAAAA GACTTATTAC GATATAACAT AAAATATTCT TCATTTTCTA 3660 

35 

TTTCAGATAA TGAGAAATCT ATAACCTCTG CATCTTTTTT ATTAAAAGTT ACTGAACCTT 3720 

TACCGTTACT TATATCATCT TCAGGTATAT ATTC 3754 
40 (2) INFORMATION FOR SEQ ID NO: 559: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 815 base pairs 

(B) . TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 559: 

SO 

ATTTAACTAA AACTATAaAT AATCAAATGA TATTGGAAGA TATTaGCATA GATATCGAAA 60 
AAGGTAAATT GACTTCTTTA ATTGGACCTA ATGGTGCGGG TAAGAGTACT TTACTTTCAG 120 
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CTGATTATAA AAATAATGAC TTGTCGAAAA AAATATCTAT ATTAAAACAA ACAAACCATA 240 

CTGAAATGAA TATTACGGTA GAGCAGTTGG TAAACTTTGG ACGATTCCCT TATTCTAAAG 300 

5 GTCGTTTGAC GAAAGAGGAT CATGATATTG TCAATGATGC GCTAGATTTG TTGCAACTAC 360 

AAGATATCAG AAATCGTAAT ATTAAGTCAT TATCTGGTGG ACAACGTCAG CGTGCATACA 420 

TTGCAATGAC AATAGCACAA GATACTGAAT ATATTTTGCT AGATGAACCA TTAAATAATT 480 

10 

TAGATATGAA GCATGCTGTT CAAATTATGC AAACGTTAAA AATGTTAGCG CATAAAATGA 540 

ATAAAGCGAT TGTCATTGTG TTACATGATA TTAACTTTGC GTCCTGTTAT TCAGATCAGA 600 

1S TTGTAGCATT GAAAAACGGA CAACTAGTTA AGTCAGATTT GAAAGATAAT GTCATTCAAA 660 

GTAGTGTTTT AAGTGATTTA TATGACATGA ATATTCAAAT TGAACATATA AGAAATCAAA 720 

GG A TT TG TTT ATATTTTAAG GATTGATAAT TTGGAGaCAG TTTAAAGGGG TGATGCGCCA 760 

20 ATTAAAGAAG GGTTAAACGT AAAGCATTTA TTTAT 815 

(2) INFORMATION FOR SEQ ID NO: 560: 

(i) SEQUENCE CHARACTERISTICS: 
25 (A) LENGTH: 919 base pairs 

(B> TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

30 

{Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 560: 
GAAACGAATA ATAAATTTAC TGAGTTATTA GTTGAAAAAG CTAATAAACA TGATGATGTT 60 

35 CTCGATAmGT TGATTAATAT TTTAAAATAA GCGATACACA CTACTAAAAT TGTATTATTA 120 
TTATGTTnAA TTGACnCCTC CTAAATTTGC AAAGATAGCA ATTTAGGAGG CGTGTTTATT 180 
TTTATTGACG TCTAACTCTA AAAGATATAA ATTAGACATT TACAAATGAT GTAAATAACG 240 

40 CAATTTCTAT CATCGCTGAT AACAATTCAT GGTTTAATAT GCAATGAGCA TATACTTTTT 300 
AAATAGTATT ATTCACTAGT TTTAACAATC AATTAATTGG TATATGATAC TTTTATTGGT 360 
TATTTTTATC CCATAGTGTG ATAATTACTA TTTTTCATTC ATAATAAAGG TTTAAAGCAT 420 

45 

GTTAATAGTG TGTAAGATTA ACATGTACTG AAAAACATGT TTAACATAAT GATATAAGGA 480 
GTGACGTACA TGATCCGTCT AGGTAAAATG TCAGATTTAG ATCAAATCTT AAATCTAGTA 540 
GAAGAAGCAA AAGAATTAAT GAAAGAACAC GACAACGAGC AATGGGACGA TCAGTACCCA 600 

SO 

CTTTTAGAAC ATTTTGAAGA AGATATTGCT AAAGATTATT TGTACGTATT AGAGGAAAAT 660 
GACAAAATTT ATGGCTTTAT TGTTGTCGAC CAAGACCAAG CAGAATGGTA yGnyGACATT 720 
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TATAAAGGAG CTGCTACAGA ATTATTCAAT TATGTTATTG ATGTAGTTAA AGCACGTGGT 840 

GCAGAAGTTA TTTTAACGGA CACCTTTGCG TTAAACAAAC CTGCACAAGG TTTATTTGCC 900 

AAATTTGGAT TTCATAAGG 919 



(2) INFORMATION FOR SEQ ID NO: 561: 

(i) SEQUENCE CHARACTERISTICS: 
10 (A) LENGTH: 518 base pairs 

{B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



15 

<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 561: 
ATCATATAAA CCGGCTGCTT CTAAAAACGA AAATACTGTT ACTGGACCTA AAAATTTAAA 60 

20 CCCGTATTGT TTTAAATCTT TAGATAGTTG TGTTGCAGTA TCATCAACTG TGATACGATC 120 

AGAAGCATGT TCATACTGCA AATCTTTAGG CTTACCATTT ACATATGACC ATAAAAATTT 180 
ACTAAAACTA CCATATGCTT GTTCAATTTT TAAATACCCT TGAGCTTGAT TAACAATTGC 240 

25 TTCTAATTTT TTACGATGAT GAACGATATT TGGAAAAGTC ATTAAGCGGT CGATATCTTG 300 
AGCGGTCATT TGTGCTACCT TTTCTGGTTC GAAATCATAA AATGCTTCTT CATAGGCTTC 360 
TTTCTTTTTT AAAATAGTTA ACCAAGATAG CCCAGCATGT TGTGaTTCTA ATGCTAAAAG 420 

30 

TTTAAACAAT GCCTTGCnAT CATAGAGCGG TTGTCCCCAT ACATGGATCm TGATAGTCTA 4 80 

AGTAGACTGG GATCTTTAGT ACCAAATGCG CATTCATT , 518 

(2) INFORMATION FOR SEQ ID NO: 562: 

35 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1539 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
40 (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 562: 



50 



CTTATTTAAA 


AGTAAATCAA 


TCAATGTATT 


ATAATCCGAA 


TAGTCCGCAT AAAGCTGGTT 


60 


TGCaGGCAAA 


t CAATTACT A 


CAACAAGCAA 


AAACCCAAAT 


TAATGCAATG rTTaATTCAA 


120 


AAACAAATTA 


TGATGTTGTA 


TTCACTAGTG 


GTGCAcTGAA 


TCCAATAATC TTGCTTTAAA 


180 


AGGTATTGCC 


TATCGTAAAT 


TTGATACAGC 


GAAGGAAATA 


ATTACATCCG TGTTAGAGCA 


240 


TCCGTCCGTA 


TTAGAGGTTG 


TAAGATATTT 


GGAAGCACAC 


GAAGGATTTA AAGTTAAATA 


300 
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5 



- 10 



15 



30 



35 



CAAAGTCGGT 


TTAGTAACAT 


GTATGTATGT 


AAATAATGTA 


ACTGGACAAA 


TACAGCCTAT 


420 


TCCACAAATG 


GCTAAAGTTA 


TAAAAAATTA 


TCCTAAGGCA 


CATTTTCATG 


TAGATGCGGT 


480 


TCAAGCATTC 


GGCAAAATTT 


CAATGGATCT 


CAATAACATA GATAGTATTA 


GTTTAAGTGG 


540 


ACACAAGTTT 


AATGGTTTAA 


AAGGACAAGG 


CGTCTTACTT 


GTAAATCACA 


TTCAAAATGT 


600 


TGAACCAACT 


GTCCATGGTG 


GTGGTCAAGA 


ATATGGTGTT 


AGAAGTGGAA 


CAGTTAATTT 


660 


GCCAAATGAT 


ATTGCAATGG 


TTAAAGCGAT 


GAAGATAGCT 


AATGAAAACT 


TTGAAGCATT 


720 


GAATGCATTT 


GTTACTGAGT 


TAAATAATGA 


CGTCCGTCAA 


TTTTTAAATA 


AATATCATGG 


780 


AGTTTATATT 


AATTCTTCAA 


CTTCAGGTTC 


ACCATTCGTT 


TTAAATATTA 


GTTTTCCTGG 


840 


CGTAAAAGGT 


GAAGTATTAG 


TTAATGCTTT 


TTCAAAATAT 


GACATTATGA 


TATCTACGAC 


900 


AAGTGCTTGT 


TCATCTAAAC 


GTAATAAATT 


AAATGAAGTA TTGGCTGCAA 


TGGGATTATC 


960 


AGACAAATCT 


ATTGAAGGTA 


GTATAAGATT 


ATCATTTGGG 


GCTACTACAA 


CTAAAGAAGA 


1020 


TATAGCGAGG 


TTTAAAGAAA 


TATTTATCAT 


CATTTATGAG 


GAAATTAAGG 


AGTTGCTAAA 


1080 


ATAATGAAGT 


ATGATCACTT 


GCTTGTTAGA 


TACGGGGAGT 


TAACATTAAA 


GGGTTCAAAT 


1140 


AGAAAGAAAT 


TTGTAAATCA 


ATTAAGAAAT 


AATGTAAATA 


AGTCaTTAAA 


AGGACTTGAT 


1200 


GGGTTTGTCG 


TTAAAGGCaA 


ACGAGATCGT 


ATGTATATTG 


AACTTGAAGA 


CCATGCaGAT 


1260 


ATAAATGAAA 


TAACATATCG 


ATTATCAAAA 


ATTTTCGGTA 


TTAAATCTAT 


TAGTCCAGTA 


1320 


TTAAAAGTAG 


AAAAAACAAT 


AGAGGCAATA 


AGTGCAGCGG 


CAATTAAATT gCGCAGaATT 


1380 


TGAAGaAAAC 


AGCACATTTA 


AAATTGATGT 


GAAGCGTGCC 


CGATTAAAAT 


TTCCCCAATG 


1440 


GATACGGTAT 


GGAATTACAG 


CGTGGAATTG 


GGGTGGTGCC 


AGTATTGGAG 


CACTTCGCCA 


1500 


TATTTCCAGT 


GGATGTCCAA 


CGTCCCAGnC 


CCAGGAATT 






1539 



(2) INFORMATION FOR SEQ ID NO: 563: 

40 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 968 base pairs 
<B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

45 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 563: 
ATAnCGTATA CATGTGTTCT TTAAAATTGT GATAAGGAGT TTAGGATGGT TTATTTAAAA 60 

SO 

TCAATAGATG CCATTGGATT TAAGTCTTTT GCAGATCAAA CCAATGTTCA ATTCGATAAA 120 
GGTGTAACTG CAATTGTTGG TCCAAATGGA AGCGGTAAAA GTAATATTAC AGATGCTATT 180 
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5 



20 



ATCTTCTCAG 


GTGCAGAACA 


TCGCAAAGCT 


CAAAATTATG 


CTGAAGTACA 


GTTAAGATTA 


300 


GATAATCATT 


CTAAAAAGCT 


CAGTGTTGAT 


GAAAACGAAG 


TTATTGTAAC 


AAGAAGATTG 


360 


TATCGAAGTG 


GTGAAAGTGA 


GTACTACATA 


AATAATGACC 


GTGCAAGATT 


AAAAGATATT 


420 


GCCGATTTAT 


TTTTAGATTC 


TGGATTGGGA 


AAAGAAGCGT 


ATAGCATTaT 


CTCGCAAGGT 


480 


AGAGTTGATG 


AAATACTAAA 


TGCTAAACCA 


ATTGATAGAC 


GTCAAATTAT 


TGAAGAATCG 


540 


GCTGGTGTAC 


TTAAATATAA 


AAAACGTAAG 


GCTGAATCAT 


TAAATAAACT 


TGACCAAACA 


600 


GAAGATAATT 


TAACGAGAGT 


AGAAGACATT 


TTATATGATT 


TGGAAGGTCG 


CGTAGAACCT 


660 


CTAAAAGAGG 


AGGCAGCTAT 


AGCTAAAGAA 


TATAAGACAC 


TTTCACATCA 


AATGAAACAT 


720 


AGTGACATTG 


TAGTTACAGT 


sCACGATATT 


GATCAATATA 


CAAATGACAA 


TAGACAATTA 


780 


GATCAACGTT 


TAAATGATTT 


ACAAGGCCAA 


CAAGCAAATA 


AAGAAGCTGA 


CAAGCAACGT 


840 


TTAAGCCAAC 


AAATTCAACA 


ATATAAAGGT 


AAACGTCATC 


AACTTGATAA 


TGATGTTGAA 


900 


TCgCTTAATT 


ATCAATTAGT 


AAAAGCTACG 


GAAGCCTTTG 


AAAAATATAC 


GGGACAATTA 


960 


AATGTTTT 












968 



(2) INFORMATION FOR SEQ ID NO: 564: 

<i) SEQUENCE CHARACTERISTICS: 

{A) LENGTH: 436 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 564: 

35 

TTGTGTGTAT GCATTCAATG TGCTCTGTTT GTAAATGGCT AGCTATATAA TTTAgGATTC 60 

GAGGATCGTC ATCGACAACA AGACATTGCA CCATAGCTAT AAACTCCCTT ATCTTTTTCA 120 

40 TTTATTATAC ATGTAAAATA TTTTTGCGTA AAAAAACAAT TGTTCATATT GAGTTCATAT 180 

TTCAACCTTA TACTGACGCT AAAGAAGAAA TAGGGAGAAG TGAATCGATA TGAAATTAGC 240 

GATAAAAGAG ATTATGTTTT ACAAATTTCG TTATATTTTA ATCACATTAA TCATTCTTTT 300 

45 ATTAAGTATT ATGGTGTTAT TTATTAGTGG TTTAGCTCAn GGGCTTGGTA GGGaGAATAT 360 

TTCGTwATTT GAACACTTTG GATAATGATG aaTATGtTGT TCaAAAAATG AAAGAGCCGC 420 

aAATTGaGAA ATCGCA 436 

SO 

(2) INFORMATION FOR SEQ ID NO: 565: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2554 base pairs 

55 



1502 



EP0 786 519 A2 



(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

5 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 565: 

ATGTTTTGTC AATATCAATT GTTTGAGATA AATCCGCTTG TATAAAACGA ACTTTATCAT 60 

W CATTAAATTT GCTAGTTAAT TCATTTATAT CAGTACGATA ATATTGCACA TAAACTTCAA 120 

ATCCATCAGT TAATAATTGT TTGACTATCT CAGAACCAAT TGAACCAGAA CCACCTAATA 180 

CTAATGCTTT CATTACTTTT TAATCTCCAA ACGACTATCG ACTTGCTGAT CTAAATTTAA 240 

15 ATATAACGAT GACGTTTCGT TAATACTATC TAACGTGATA TTTTCAACAA TGTCTAACAT 300 
GTCAAACACG CTAACACCTT CAAAATACAA TTTAGTATAT TGATTAGCAA TATATTCAGG . 360 

TGAGTTTAAA CTTGATATGA ATTCACCTAT AAATTGCTTT TTCAAAAGTT CAAATGCTTC 420 

TGCATCTTGG AAAtTGCCTT TTTTATCACG CAACTCATCT AATAATAATT TTTTTAATTT 480 

ATCTGGTTCT TCAGTAGCAC TTGTCACGAT TGAAAAACTA TACGTCGGCT CTAGTACAAA 540 

TTGATAACCA AATGTATCAT CGATAAGTCC TTCGTTTAAT AAATTCTGAT AAAAATCTGT 600 

25 

TTCTTCCCCA AAAATTAACT CAAAGAATAA TGACATTTCT AAATCACGTT GTACATATTT 660 

TTGAGGCGCT TCTTGTAATG GTTTATTTTT AAAACCAAGC ATTAGTCTTG GTGATTGAAT 720 

30 TTTCATAGAT TCAGTAACAA ATGCTTCTTT AACATCcTCC GGTTCATCAA CAAGTCCTCG 780 

TTCGATTTTG GGTTGGTTAA CTTTATTACG AGCATCCTCG TGTTGTTTTA CTATTCgACA 84 0 

TATTGCTTCA GGATCCACAT CGCCAACAAC AAATAAAACC ATATTTGATG GATGATAAAA 9.00 

35 CGTTTCATAA CATAGATACA AATCATCTTT TGTAATATCG TATATACTTT CTACACTACC 960 

GGCAATATCA ACACGTATTG GATGTTGTTG ATACATTGCA CGCAAtGTAT TaAACATTAA 1020 

TTTATATCCA GGTTGCTCTT GaTACATTTT TATTTCTTCT GCAATAATAC CTTTTTCTTT 1080 

40 

ATCAACAGTT TCTTTTGTAA AATAAGGCGT TTCaACCATT GTAAGTAAAC GTTTAATGTT 114 0 

GTTTTCAATA TtATCAGTTG CACTGAACAA GTAGCTTGTA CGATCAAAGC TTGtAAACGC 1200 

ATTTGCTTGT GCGTTATCTT CAGCAAACGC AGTAAATAAG CTTCTTCTTC TTTTTCAAAT 1260 

45 

AATTTATGTT CcTAAAAAGT GAGCAACTCC ATCAGGTACA GTAACAAATT GGTCTTGTCC 1320 

AAGGGGTTTG AATTGATTAT CTAATGAACC AAATTGTGTA GTGTAAGTGA cXAATGTCTT 1380 

50 TTGAAAACCT GGlTkGGGGA TAATAAATAA TCGTAAACCA TTTTCTAATU CTTGTTCGAA 1440 

tACTCTTTCG TCTATTAATT CATAATAACG CTCTTTCATT ATTTATCCCC TCCTTTTGTC 1500 

AACACATAGA TtGTATCTAA AAATGCTTTT TCAGCAACAG AAACAATATC TTCGCGACTT 1560 

55 
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TTATGCATAA TCTCTATAAT ACTTTTCGGA CGATCTTCAG ATTCATATCG ATGAGAAATG 1680 

ATTACTTTTT TAGCTAACTC TAATTTTTCT TCAGTGAAAT CTCCTGCTTT TATTTTTTCA 1740 

AATTCACTTA TAATAGTGTC TTTTGCAGTT TCGTACTTAT CACTTGAAAC CCCACTCAAA 1800 

ACAAATAAAT AGCCATTTTT GCCATCAATT TGTGAATGTA TAGAGTACGC TAAACTTTGC 1860 

TTTTCTCGCA CTTCATTAAA TAAAACAGAT GAAGGATCTC CTCCAAACAT CATGTTAAAT 1920 

ACAACAAAGG CAGCATATCC ACTTTGTCCA TATTGTGTTG GAAAACGGTA TCCCATATTT 1980 

AATTTAGCTT GATCCACGTC ATCATATTCA ACAATATAAT CAACTTCTTC ATCGTGTAAA 2040 

15 TGATGAGTAG AATGTTGGAA TTGATGTTTA TCGAATGGTT TAAGTGCAAA TTTTTCACGT 2100 

ATTTGTTTCT CAACACTTTC AGGTTCTACA TTGCCGACAA CATAAACAGA ACATTGATCA 2160 

TTATTAATCA TTGATTGATA TGTATGATAT AGTGtTTCAG CAGTAATATG . TGGGATTTGT 2220 

TCTAGTTGTC CTGTAGATAA GTATTTATAT GCTTCATTTT CAAACATATG GTCGAGTAAT 2280 

TTTAAAAACG AATATTGTGC TTTATTATCT ACCATTGCTT CTATTTTTTT GGCTAATAAT 2340 

GTTTTCTCTT GGTTAACAAA ATTATCATTG AATGCTTTAT TTTCAATTAA TGGATTCCAA 2400 

ATGATTTCTT GtAATAAATC TAATCCTTGa TTAAATAATG AwTCACCGkT TCyTAAATAA 2460 

CGkkCaTTAA caATTyCTAA tGaAAATGtA ATgACaTGCT GaTCTTTGAA TTTTGAAATT 2520 

GTACTATTCA CATACGCACC ATATAAATCG GCTA 2554 
(2) INFORMATION FOR SEQ ID NO: 566: 



20 



25 



30 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1424 base pairs 
35 (B) TYPE: nucleic acid 

{C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 



40 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 566: 

TnTCGCTATT TTnAATTGGT TTTGTATGGT TTAAGTTATA TCAATATACA ACAnACCCTA 60 

AAGCTGATAT CCCAGGTATC ATTTTTAGTA CGATTGGTTT TGGTGCTTTG TTATATGGTT 120 

45 

TCTCAGAAGC TGGCAACAAA GGTTGGGGTT CAGTAGAGAT AGAAACAATG TTTGCGATTG 180 

GTATTATCTT TATTATTCTA TTCGTTATTA GAGAATTAAG AATGAAATCA CCAATGTTGA 240 

50 ATTTAGAAGT ATTGAAATTC CCaACATTTA CATTAACAAC AATTATTAAT ATGGTTGTAA 300 

. TGTTAAGTTT ATATGGTGGT ATGATTTTAT TACCGATTTA TTTACAAAAT TTACGCGGAT 360 

TcTCAGCATT AGATTCCGGA TTGTTATTAT TACCTGGTTC TCTAATTATG GGTCTACTAG 420 
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5 



10 



15 



20 



25 



TTGCTGTAAT 


GACTTATGCA 


ACATGGGAAT 


TAACTAAATT 


AAATATGGAT ACACCATATA 


540 


TGACAATCAT 


GGGTATCTAT 


GTACTTCGTT 


CATTTGGTAT 


GGCATTTATA ATGATGCCAA 


600 


TGGTAACTGC 


AGCTATTAAT 


GCGTTACCGG 


GACGACTTGC 


CTCTCATGGT AATGCTTTCT 


660 


TAAATACGAT 


GCGTCAATTA 


GCAGGCTCTA 


TAGGTACAGC 


AATCTTAGTT ACTGTAATGA 


720 


CAACACAAAC 


TACACAACAC 


TTATCAGCTT 


TTGGGGAAGA 


GTTAGATAAA ACGAATCCTG 


780 


TTGTACAAGA 


TCATATGCGT 


GAATTAGCAT 


CACAATATGG 


CGGACAAGAA GGCGCAATGA 


840 


AAGTGTTACT 


ACAATTTGTA 


AATAAACTAG 


CAACGGTTGA 


AGGTATTAAT GATGCATTTA 


900 


TAGTTGCAAC 


GATATTTAGC 


ATCATCGCCT 


TAATTTTATG 


TTTATTTTTA CAAAGTAATA 


960 


AAAAAGCAAA 


AGCTACAGCT 


CAAAAGTTAG 


ATGCAGATAA 


TAGTATCAAT CATGAATAAA 


1020 


TAAAATAAAT 


TAATTGAAGT 


GTGACTAATC 


AAAAATTATG TTGTGGGGAC ATGATTTTTA 


1080 


AAGTATCGGT 


GCCAAATATG 


GTTATCGATA 


CTTTTTTTAT 


TTGTTGATTT ATAGAATGTT 


1140 


AGAGGAATTA 


TATTAAAATT 


TGGCATTGAC 


GTAGTAGGTC 


ATTAATAAAG AAAAAGCAGG 


1200 


AAGTGGGTCA 


ACGAAATGAA 


TTTTGTGAAA 


ATAACATTTC 


TGTCCCAATC CCTACTATAT 


1260 


AACATTATTT 


TAAACGAGGC 


ATGCGATTAC 


GGAAGAATAA 


GCTTATAACA AGTAAACCGA 


1320 


TGCTACAGCC 


AAGTAAAATG 


ATGCCGTTAT 


GAATAGCGTC ACTTgCTGTA ATCACTTGAT 


1380 


CTGGTGGTAC 


ATTTAAATAA 


TATTTTTTGA 


AAACATCTGC 


AATT 


1424 



(2) INFORMATION FOR SEQ ID NO: 567: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 676 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



40 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 567: 



45 



TCTCCCATGT TCTGCTAAAT 


GACGCATCAC 


TTTTACTTCA 


TGAGGCGTCA 


ATACACGTCC 


60 


TTCACCAGCA TTCAAACCGA 


CAACATTTAA 


AGGCCCATAT 


TCAATACGAG ACAGTTTCGT 


120 


CACTTGATGA CCAAAATGTT 


CGAACATTCT 


TCTGACTTGG 


CGATTACGAC 


CTTCTGTAAT 


180 


TGTAATTTCA ACCAATGTTG 


TGTTTTTATC 


TTTATCTTGT 


TTCTTAACTT 


TCACTTCAGC 


240 


CGGTTGCGTC ATACCATCTT 


CTAATTCAAT 


ACCTTTTTCT 


AGCGCTTTCA 


CTTCTTCTCT 


300 


CATTAAATAA CCTTTTAATT 


TCGCAACATA 


TTTTTTCTTA 


ATTTGATATC 


TTGGATGTGT 


360 


CATTAAATTA GTAAATTCAC 


CATCATTTGT 


GAGTAATAAC 


AATCCAGAAG 


TATCATAGTC 


420 
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ACGTCCTCTA TCATCAGATA CACTTGTkAT CACTTGAGTT GGkTTATGGA AkAAAATGkA 
AAtTTTGTCT TCTAGTTCTA TTTTAATACC TTCAACTTCA ATCGTATCTG ATGGCTTCAC 
TTTTGTTCCT AATTCAGTGA CAGTCGTACC ATTCACTTTC ACTTTTCCTT CAGAAATTAA 
AGTTTCTGCC TTACGT 

(2) INFORMATION FOR SEQ ID NO: 568: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 454 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
<D> TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 568: 
GAAACGGTTC TACCAAAAAA CAGTAAGGGC TAAACCCAAT CATGGTAAGA CAAAAAGTAC 
AAATAGCCAT GCCCAAGTTG AACTCGCTGT ACGCCTATTT CTTTCTAAAA AGATAATAAT 
AAAAGCCAAT ACTAAATTAA TGATGAATCC AATGGCTAAA ATAATAGTAA ATAACGTTCC 
TAAAXCGTTT GAAAATGTAA ATCGCATAGT CTITTCTCCT ATAAAGAAAG GCACAAAAAA 
ACATTTTGCA CCTTTCACGT CATATTATTT ATTCACAGAT AAAGTTAAAA TTGcATTGAA 
TTCTTCTTCA TTATTTGGGA ATGTTCTTTC TTCTATTTCT TTAATAGTAA TATTTACTAA 
TTTTAAATTT GTAGCTTCTT CAGAACTTAA AAAAGCATTA ATGTTTTTTT CTAATAACTC 
kAAAGTCTCA GCTGtAAAaG TTTTAAGTTT AATT 
(2) INFORMATION FOR SEQ ID NO: 569: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 894 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
<D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 569: 
ACGATATTAC CACCCTCTGA AATAACATCA ATCATGTGAT CTGTAAAGTC CCAAGGATGA 
^ CTTGTTGTGA AACGAACTCT TGGAATCGCT ATTTTAGAAA TTGCTTGTAA AAGATCTCCT 
AAGTCATATT CTATATCCTG TAAATCTTTA CCATAAGAAT TTACATTTTG ACCTAAAAGC 
GTTATTTCTT TGTAACCTTC ACGAGCAAGT TCACGTACTT CATCTATAAT GTCTTCAGGT 
CTACGGCTTC GTTCTTTACC TCTTGTAAAT GGAACAATAC AATATGTACA AAACTTATCA 
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TCAATAACGT CTCCTTCTTT AGACCATACT TCAACAACCA TTGCTTTAGA TAAGTATGCT - 420 

TCTTCTAAAA TTTCTGGTAA ATGATGAATA TTATGTGTAC CAAATATCAT ATCTACATTT 480 

TGATACGATT TTAAAATTTT ATTCACTACT GACTCTTCTT GTGACATACA ACCACAAACA 540 

CCGATTAAAA TATCAGGTCG TTCTTTTTTC AAATrCTTCA AATTACCTAT TTCACTAAAC 600 

ACTTTGTTCT CGGCATTTTC TCTAATCGCA CATGTATTAA TTAAAATAAC ATCTGCAGTG 660 

TTAATATCAG TCGTkGCTTG aTAGCCTAAT GCyTCmAGTA TACCAGCAAT GACCTCAGTG 720 

TCATGTGCAT TCATTTGACA TCCATATGTT TTAATTAAAA ATGTACGCTC GTTCCCGATA 780 

j 5 CCGCGATATT TTyCATCAAT TtGGgAAATC nCTATTATAA CGAACTTCTk GTtTACCnCC 840 

TTTTTTnCGC TCCTTTAAAA TTAAGGCGGC TGATAAACAG GTCCAAAATA TTAC 894 
(2) INFORMATION FOR SEQ ID NO: 570: 



10 



20 



25 



30 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 441 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS: double 
(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 570: 
TATCAATCCC ACAGCACATG CTGAACAAGA TCAAACATGG GAGAAGATTA AAGAACGCGG 60 
TGAACTTAGA GTGGGTCTTT CTGCAGATTA TGCACCAATG GAATTTGAGC ATACAGTTAA 120 
TGGTAAGACT GAGTATGCAG GTGTAGATAT TGATTTAGCT AAAAAAATTG CGAAAGATAA 180 
35 TAATTTAAAA TTAAAAATCG TCAATATGTC ATTTGATAGT TTGTTAGGAG CTCTTAAAAC 240 
TGGAAAAATT GATATTATTA TTTCCGGAAT GACTTCAACG CCTGAACGTA AGAAGCAAGT 300 
TGATTTTTCA GATTCATATA TGATGACTAA AAATATCATG CTTGTAAAGA AAGATAAAGT 360 

40 

TAATGAATAT AAAGATATCm AAGACTTTAA TAATAAAanA GTnGGGGCAC AAAGGGACTG 420 
AACCAGAAAA AATCGCTCAA C 441 
(2) INFORMATION FOR SEQ ID NO: 571 : 

45 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1205 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
so (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 571: 
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AAGTCGTTCA TCTTTTTCTA CAAGGGTGTA AAAATAATCA ATCATATCGT ATAACGCTTC 120 

TTTACCAATG ATGTCATATG GTGTTGTTGT CATTTAATCA CCCATTTTCA AAAATTTACT 180 

5 

GTTACGAACT TAAGTTAATA TATAACTAAT ATAACATGAT TTTAAACATT TGAAAGAAAT 240 

ATGCATATTT GCCAATTTAA TTTATATTGT TTGAAAGTGT TTCTTTTTTC TTGAAAAAAC 300 

GTTGAACTTT ATTTAiAAGGT tGATGATGTT CGAGGTTTAG TTCGTTtAAT AAAGATtGGA 360 

10 

ACTTTTGTAA ACCTTGATTA TAGTCTTTAA CTTCGAACTC TAACTCATAA TCCGTAGTAT 420 

CGAAATACTC ACTTTTATCT AAAACCAGTA AATCACCTTT ATATTTAGTT TCTTGGCGAT 480 

15 ATGTCGTTAA TGCACCAAGT ATTGATAAAG TTGTATCTTT TACAGCAAAC TGTTCAACTA 54 0 

TAATTTGACG AATGTCATCT GGAAGATTGT CGTTTGAAAT AATCAAGTTC ATCTCTGGTT 600 

TAATGTCGAC GATATAGTTG TATTCTAATA GACCAACCTT TGCTGGTGTC TTTAAAGTCA 660 

20 

TTTCATATTG ATTGTCTTTA ACTCTTATGC GTAGTGCAGA GCGATGTTCC TTTAATTTGA 720 
AATCGGGTGT ATCAATATAG TAATTGACTT GCTTAmAAAG CACACTGTCT TTAAAATATT 780 
TCTCTTGCAA TTTATTATAG ATTGAtGCAG TTATCATTTG TtTAAATTCT ATtTCATGAT 840 

25 

TTGTTGCCAT GATATGTATA CACCTCGTAT CAAATTCAAT TTATCTTAAC TATATTATGA 900 
ATGACAAAGT TGAATTTTAA AAGTAATTTC CTTTATCTAT TATCAATGTT AATTTGACCA 960 

30 TTAAAAATAG TGTTCGTAAG TGTTTTGTAT TATTGaATTG TGTTAAAATG TTATGGAATA 1020 
AGAGGAGGAT TAAGCATGsG TTTwTATATT AATGAAATTA AAATTAAAGA TG A CAT ACTT 1080 
TATTGTTATA CAGAAGATTC TATTAAAGGA TTATCTGAAG TAGGACAAAT GCTCGTTGAT 1140 

35 AGTGATAATT ATGCCTTTGC GTATACATTA GATGATGGTA AAGCGTATGC TTATCTCATT 1200 
TTCGT 1205 
(2) INFORMATION FOR SEQ ID NO: 572: 

40 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 570 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

45 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 572: 
50 TGAAGAAATA GCAATGATGA AATGCCGTAT GTTATATGAG ACGGGGTCAT TTCTTGAATT 60 
AAGAGAAGAA ACAATTGTCT TATTGAAAAC TGGCATACAA CAATATGATG CATTGATGAT 120 
TTATTACGTG AAAAGTTTGA TTGGTTTGGG ACAATATTTT GAAGCGGTAG AAGTAATTCA 180 
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ATTTGCTAAG TCAAAATTAA TTGAAGATGA AAAACGATTG ACTCAGTCAT TAGCTGATTT 300 

TGrTACGTTA TCAATGAGGG AACAGACGCA CTTGATTTTG AAGTTAATAG ACAATGGTCA 360 

5 

TTTTCAATTT CAAGAAACGG TATTATATAT ATkAAaAyCT AATaCGTACa GTtATAACCT 420 

CATTAGTTTA ATGATTGAGT ATTTAAGGTT CGCAAATTGT ACACAAGAAC TGACAATTGA 4 80 

AAAGTATGGT ATGGATGTAA CTTTTGTACC AGCTAATTTA AAAGGGCTAG AACATACAAC 540 

10 ■ 

ACTTAAAGAA AAAGTTATAC CTAACGTTAT 570 
(2) INFORMATION FOR SEQ ID NO: 573: 

is (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 939 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

20 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 573: 

TATTTCTGTG GTGTAATTGT TGACGCTCAT 60 
ATCATTGCTG CATTATCAGG TTTAGTCAGC 120 
TTAGTTGTAT TACTAGGATT TAAAACTTTA 180 
CTACTTCTAT ATCGTTTTGC GTACTATTTT 240 
TCATTTGAAT TTGGTACATC AGCTAAGAAG 300 
GCTAAAGATG TTACGTCATT TTTAATGTCT 360 
TCATTATCAT TAGCAATTTT AGTATTCTTT 420 
ACGATTGTkT ACGATGCTTT tATATGATGG 4 80 

AATTCATACT AGTGCTTGTT TATTACTTTT 540 
TAGACGTGCC ATTATCTTTG CTATGATTTC 600 
CACTTACGCT TCATATATTT TAATAACATG 660 
AGCTTTCCGT AGAGCGAATA GGTTGAAACG 720 
GCTTTTATTC AGTTTATTTA TTTTATATGT 780 
TGCATTAGAT ATTTATACGA TTGAAATGCA 840 
TACGATTTTA ATCATCGCTA TCATCATAGG 900 
TAGCAAAGT 939 
(2) INFORMATION FOR SEQ ID NO: 574: 

55 



1509 



GTTGAATGGT TAGCAGCTGC AGTTGTATTA 

25 

GTATCATTCA TGTCCTTTAT TGCAATATTT 
TTTATTCCTG GTGGTTTCGG CGCTTTCGAT 

30 GGTGTCCCTG AGGAAAAAGT ATTATTAATG 
GTACCGGTAA TTATTGCATT AATTTTATCA 
TACATTGAGG GATCTAAATA CTTTATTCCT 

35 TATCAAAAGG ATATTATTGC TAAAATTCCA 
ACAAGTATGA TCTTTTTTGT AAATAACTTA 
AAATCACTTA ACGTATTATA TTCTATtGGC 

40 

ACTGAATGTA GTTGGTATTT ATAAGCAAAG 
AATTTTATTA ATCACAGTGG CGACATTCTT 
GTTAGCTATT ATTTTTGTTC TGCTTATTGT 

45 

CCCAGTAAGA ATGAGAAATA TAGTTGCAAT 
TAACCATATA TTTaTTGCTG GAACGTTATA 
50 TACATCTGTA TTGCGCTATT ACTTCTGGCT 
TATGATTGCA TGGTTGTTTG ATTATCAATT 
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(A} LENGTH: 1059 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY : linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 574: 



10 


GAATTAATTA 


AATATTACAC 


ACAGCCTCAT 


TTTTCATTTT 


CAAATAAATG 


GCTATATCAA 


60 




TATGATAATG 


GAAACATTTA 


TGTTGAACTT 


AnGAGATATT 


CATGGTCAGC 


ACATATATCT 


120 




TTATGGGGCG 


CTGAAaGTyG 


GGGAAATATT 


AATCAGTTAA 


AAGATCGTTA 


CGTAGATGTG 


180 


15 


TTTGGACTAA 


AAGACAAAGA 


TACTGATCAG 


TTATGGTGGT 


CTTATAGAGA 


GACATTTACA 


240 




GGTGGCGTTA 


CACCAGCCGC 


AAAACCTTCT 


GATAAAACTT 


ATAATCTTTT 


TGTGCAATAC 


300 


20 


AAAGATAAAC 


TACAAACGAT 


TATTGGTGCG 


CATAAAATAT 


ACCAAGGCAA 


TAAACCAGTA 


360 


TTAACATTGA 


AAGAAATCGA 


TTTCCGTGCA 


CGAGAAGCGT 


TAATAAAAAA 


TAAAATATTA 


420 




TATAACGAAA 


ATCGTAATAA 


AGGTAAGCTT 


AAGATCACCG 


GTGGCGGTAA 


TAACTACACT 


460 


25 


TV ft ^PT^^P IS TV 




ACAiTCAGAT 


CTAGCAAATG 


TTTATGTTAA 


AAATC CTAAT 


540 




AAAATAACTG 


TTGACGTCCT 


CTTTGATTAG 


TATATGAAGG 


TGACTTATAC 


TTCATGCACT 


600 




TTAATTCCAA 


ATCAGATTAT 


TTAAATGATA 


ATTTTTAAAG 


TGTATGATGT 


ATATAATAGG 


660 


30 


TAAAATTTTC 


TATATATTTA 


AATGGAATTG 


GGAGTAGGAA 


TGTGACAGAA 


ATAGTATTTT 


720 




ATAAAATTTA 


TTCtTGTCAC^ 


TCCCCAACTT 


GCACATTATT 


GTAAGCTGAC 


TTTCCGCCAG 


780 




CTTCTATGTT 


GGGGCCCCGC 


CAACTTGCAT 


TGTCTGTAGA 


aTTTCTTTTT 


GAAATTCTCT 


840 


35 


ATGTTGGGGC 


CCCGCCTATA 


ATTGAAAAAT 


GCTTGTTACA 


TGGGCATTTT 


CATTCGGTCA 


900 




ACTACTACCA 


ATATAATATT 


GtAGaGCCTA 


AGACATTGAT 


TTATTATGTC 


TTAGGCTCTA 


960 


40 


TTCCTTCATT 


TAATGATTAA 


nTTATTATAG 


CAATACTTTA 


TTGTCCCATG 


ATTAGTGTTC 


1020 


TTTTAATGAG 


ACATAGTAAC 


TATAAAGTTT 


AATAATCGT 






1059 



(2) ; INFORMATION FOR SEQ ID NO: 575: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 574 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



.(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 575: 
GTTTGCTTTA GGTCCTGTTT CATATTTATA CTTCGAAGGA TTTACCTTTT TGaAGTCTGG 60 

55 
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TTCAACTkGC TTTTTATTCT TTTCGAAATC AGCTGGTTGA GTAGTTATGA GTTCATTATT 180 

TTTATTAGmA TAAATCTTAC CATTAACATA TTTATAATCT TTTGTTATAA AGTCACCATT 240 

5 

TCTGAATGGA ACTACTTGAT TATGACCTTT AGAGAATAAA TCAGTACCGA ACATTAAATA 300 

GTTCTTCGTA TCTATACCAG CCAAATGTAA AATTGTTGGC ATTACATCGA CTTGACCAGC 360 

ATATTCATTA TTGATACCAC CAGATTTACC AGGGATTTTA ATCCAGAAAC CAGTTCTGTT 420 

10 

TAAATCTGTA AATTTAGCCG GTGTGATTTT TTCACCTAAT AGTTTTTCCA TGGCATTGTT 480 

ATGGTTTTCA GAGATACCAT AGTGGTCACC ATAAATCATA ATCACTGAAT TGTCATATAA 540 

15 TCCTTTTTTC TTCAAGTCAT TAATATATTC TTCT 574 
(2) INFORMATION FOR SEQ ID NO: 576: 



20 



25 



30 



40 



45 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 796 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



• (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 576: 

CAATGTTTTA TAGTACAATA TATTTTnAAT AATACTCGTT AAGGAGAATG ATATGATATC 60 

AATTCACGCA ATTTCGACAG GAAAAATCCA AGATTTGCCT TATAGCTCGA AAAGACCGAT 120 

GCGCTCTGCT TTAGATAAAA CTAAGATTTC ACAAACAACA TGGTTATCTT CAACTGGTTT 180 

CACTGGTGAT GAACAGGCTT ATAAAGATCA TGGTGGACCA CATAAAGCAG TTTGTGGGTT 240 

35 TAGTAAGCAT AATTATGCAC TGTATCAAGA TGATTTACCT ACACTACCTA CTCATGCGAT 300 

GTTTGGAGAG AATTTAACAT TTGATTATTT AGACGAATCT GATGTTTACT TTGGTAATCA 360 

ATATCGTTTA GGTGAAGCGT TAATTGAGGT TTCTGAAATT AGAGAACCAT ACTGGAAAAT 420 

TCAAGCAAAA TATAATATTC CTGATTTAGT GAAGCGCATG TCTACATCTG GTAAAACAGG 480 

TTTCTATTTC CGGGTATTAA AACAAGGCTA TGTATCTCCA AATGATCAGC TTTACTTAAT 540 

ACAAGAAGCA CCAATCGAAC ATCGTTTATC TGTACAACAG CTTAATGACC TTTATTATAA 600 

TGATAGACAA AATCAAGaTA TGTTACGATA TGCACTAAAC AATCCATTTC TGTCACCAAC 660 

AAGACGCGAT AAACTTCAAA AAATGTATAA CAGAACATTG GAAATAATTA CCTTTCATTn 720 

50 ATAAGTGTTA AATGAACTTT TCAAAACAnA AAGGAATCAA CTTCACACAT CGTTTGTATG 780 

AATAGTCTTA TCTATA 79$ 
(2} INFORMATION FOR SEQ ID NO: 577: 

55 
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(A) LENGTH : 1095 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 577: 



10 



20 



25 



30 



35 



40 



AGAAATTATG 


ACAAAATATA 


AAGATGGAAA GTTAGTTTAT 


GCATCAGTCG 


AACCAGGATC 


60 


TTACGTAATA 


CATAAAGATG 


ATGCAATTAA ATATGACGAT 


TATTCTAAGT 


TAAAAAAATT 


120 


AAGTCAGCTA 


ACTAAACTTG 


ATCATCCAAA ACCAGTTCCA 


TATAGCGTaC 


TCAAATCAAA 


180 




TACCTTTAAC 


AAGCGTTTCA TTTATGACAC 


ATGGATCAAA GGATACTAAA 


240 


GATGAAGTGT 


TGCCGGCATT 


GGCCTATTTC ACTTTTTCAC 


CAAAAAATTA 


TGAAGACAAG 


300 


TCTAATCCAG 


ATCCAAAAGT 


TTTAAATTTA GTACATATGG 


ATTTCTTAAA 


TGCATCTAGT 


360 


GATTTTGGTA 


ACGCACATTT 


TGTTGTTTTA AGTAAATATA 


TTAAAGAGTA 


TGAATCAAAC 


420 


TATGAAACAG 


CGTCAGATGA 


TTCTTTAAAA TAGTATTTAC 


TGTGTGAAAA 


ATAAAtAGTG 


480 


TACTACATTA 


AATAATCGCA 


ATAATAATCC CGATAAACAA 


TCAGCATTAC 


TGCTTATCAC 


540 


ATAGAGTTCG 


TAATAACTAT 


AACTCTATGA TTCGCAAATA ATAAATGATT 


GTCATCGGGA 


600 


TTTATTTTTA 


TCAATTTATA 


AAGTGACATT ACCTTGTTCA 


TCAGCAGGTT 


TGAAAACAGT 


C C f\ 


AATCACTGCA 


CTAATAATTG 


CTAAAATGTG TGGGATACCT 


GTCCAACAGA 


ATATTAAGTG 


720 


TAGAATACCT 


TGCATATTCT 


TGCCGGCATA AAATTTATGA 


ATACCAAAAC 


TACCTAAGAA 


780 


CAATGCTAAT 


AAAATATAAA 


TAACTTTGTT TACTTGCATT 


TCTTTCCCTC 


CAGTTGAATT 


84 0 


GCTTATAATG 


ACATTAGCTT 


CTCTTTTTAT TATACCCACT 


TTTAGTTCAA 


ACATTCTAGT 


900 


TTAAGCATTC 


CCAATCATCT 


AAATTTCAGT TATTCAATCC 


TTACAATAAA 


TTTAGGATTA 


960 


CATTTCAGTT 


GCATTGTATT 


ATTTTACGTG TGAAATATAC GTAATGAATC ACATGACAAy 


1020 


CTyCAAATTG 


AAAAATATAC 


ATTCTATGAT GTAAGGTCGC 


ATTTTTAATA 


TATTTACGTn 


1080 


AAAATAGTTT 


GGATG 








1095 


(2) INFORMATION FOR SEQ ID NO: 578: 









<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 489 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
so (D) TOPOLOGY: linear 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 578: 

55 
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w 



15 



20 



25 



30 



45 



50 



ACTGCCAAAA TAATCATAGC CATGTTCTAC AGCTGCTTTC GCTACAATAT CCAAACGCAT 120 

TTCAAAACAA GCGGTACAAC GTAAGCCGCC TTCTTTTTCA TCAGCTAATT CTTTATCCTT 180 

CACCATTTTC ACAAACTTAT GTGGTTCATA AGGTGCTTCA ATATACTTCA CATTCGCACC 24 0 

AGTCTTGCGA TTAAAATCTT CCACAAATTG TTCTTGCACT TTAGCACGTC GTAAGTACTC 300 

ATTTTTCGGA TGAATATTTG AATTCGCGAA ATAAATTGCA ATGTCTGCAT ATTGTGTTAA 360 

AAACTCTAAT GTATATGTAC TACAAGGTGC ACAACAACTA TGCAATAAGa TTTTAGGTCT 420 

GATTGCTTCT CTTTCCCACT GsCCGATTAA TnTCTTCAAC ACCTTGTCCA TAATTAATTT 480 

GTnGATTTn 489 
(2) INFORMATION FOR SEQ ID NO: 579: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1287 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 579: 

CGTACTGCAT CATTTGTTGA AAAATTTGCA AACTTCTTCA AGATGTTATG GCTTAGACTT 60 

AAAGCGATGA AGCACTACAA AGCCTTAAAT AAAGAATCTA AGAAGCAAGA ATTTGAAAAT 120 

TCATTCAAAG ATGTTCAAAA AATTATGCGT ATTGTGAATC ACAATATTAT TTTACGCTTA 180 

AAAGAAGAAC AAAATAGTAC AAATGTACTT GAGGTTAGCT TAGTCATTAA TCATTACTAT 24 0 

35 GATATGAGTC GCTCATTAAA GTGGCGTGCA CAACGTCGAA AAGAACGTCA AGAAAACAGC 300 

AATCAAATCA TACCGCAAGC TATGTTCCAT AACCACAAAT TGGAAGCATT GTACTTACAA 360 

CGTCATCTTT TAGATGAATT AATTCGCAAA AATAAAATCA ACAATATCGT TGCAGCTCAA 420 

40 ATTCGAGAAA ATATCAATTa CAACGAAATT GTCTTGTCTT TACAGTCCAA ACATTaAGCA 4 80 

AGaCwTaCaw TmCCCCCGTA CATATGAGAC AAAGTCATTA TCATCTCATA TGTACGGGGT 540 

TTTTATATTC AACATCAAAA AATCAGATTG ATGAAAAGTA AATAACCTTT CATCAATCCG 600 

ATTTGATTAT AGAATCTATT TTTTAAGTTT AAATGGAATT GTACATACGT TAACATTCTT 660 

TTGATAAATT AAATACAATT TCATACGCAA ACTAGTTTGA TTGTGTAATA AATTATGCCA 720 

ACGTTTCTTA GTAATAAATT CTGGTATCAC TACTGTAATC ATATAGTTTT GATCGTTGGC 780 

TTTACGATTA ATCTTATCGA TAAAACGTGA AATTGGTCGT ATAATACTGC GATATTCCGA 84 0 

ATGTAAAATA ACTAATCTTA CATCTGGGAA ATGACGTTTC CATTTCTCTT GGAATGCTTT 900 

55 
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TGCGTAATAA ATAGACTTAT CAACTGCTGT TGTAATACTT GTTATCGGCA CAATTGCTAA 1020 

ATTACGATCT ACCACGTCCA CATTAAGAAC ATCAATGTCA GAACGTAATT GTTCTGCGAT 1080 

5 ATCTCGATAA TGkTTGkTAA TTTTCAAGAA GAAAATCACC ACGAACGGCA AGAAAATAAG 1140 

TATCGGCCAT ACTTGGCTAA ATTTAGTTAT GAGTAAAATC cATAAnAACA ATAAATGTCA 1200 

CGATACCACC AAGTAAGTTC ACAGACAACT TACTTAACCA ATTCTTAGGA CGTTCATGAA 1260 

10 . " 

TCCATTTAAT AACCATACCG AATTGTG 1287 
(2) INFORMATION FOR SEQ ID NO: 580: 

15 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1223 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

20 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 580: 
GCCTCCTTTC CTATATCCAT GGGTGTCCTA GTTGGGAATG GCTTATTCCC TATCCCAAAC 60 

25 

ATCTGTCAAT TCAAGACTAT CACTGTATAC TAAATCGCCT nTCTATACnT CCATnCATTT 120 
CATTTTCCAG TTGGAACAAT TTGTTTAATT ATTTTAAATA TCATTATCAA TCCAGAAGTA 180 
TTTACTATTC ACTTTTACAA TAATCAATCA TTTAACTACA CATGGGTAGT CGGTGGTTTG 240 

30 

CTTGGGGTTA GCTTTTTAAC TGGCAATTTA TTGTTATTGC CAAAATTAGG TGCAACATTA 300 
ACTGTAATTG CAACAGTTGC GGGTCAAATT ATTATGGGTG TCATTATTGA TACATTTGGA 360 

35 TTATTTGGCG CTACAATTCA TGATTTTAAT TTAATTAAAG CAATTGGAGT ATTGTTACTC 420 

ATTGTCGGCA TCGTCATAAT GAATCAATTT AACAAGAATA ATTTATTACT AACTGATCAA 480 
AAGTATTTAC TGTTTTGGCT TCTATTAGGA TTTATTTTTG GTTTCTTTCC ACCTATTCAA 540 

40 ACGACAATTA ATAGTGCTTT AGCTAGTCAT ACTCATTCAC CAGCCTTTGC ATCATTAGTA 600 
TCATTTACAA TTGGGTCAAT AGCGCTATTG ATTTTAACCG CTATTTTTAA TCGTTCTTTA 660 
AAACTAAAAA CAAGTCATTT AAAATTCGGT AAATTAAAGC CTATCTATTT TACTGGCGGT 720 

45 

ATACTTGGCA TGGCTTTTGT AACAGCTAAC ATTATCTTAA TGCCTCATAT GGGTGCAGCA 780 
TTAACAACAC TTATTGGGAT GTTTGGCCAG ATTCTAATGG GCATATTGAT AGATCACTTT 840 
50 GGATTATTTG GTTCACCTAA AATAGCAATG ACATCCAGAA AAACTATTGG TCTATTATGT 900 

ATTTTGACAG GCATTATACT TTTAAGATTA TTTTAAATTA ACTTTTAGCT TATCATTTTA 960 
ACTTGTAATT ATTTTTAAAA GTGATAAGCT ATTTTTTTGT GGTCTAAAAA TCTTTAGAAA 1020 

55 
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CAACTCATTC TTAAGACCTA AATTAATGTT ATnTTTTAAT AATTTACACC AAATTAATAG 1140 

CAAAAATTAT GTTATTCGTG CTAATATTTC ATAGTTGGTT ATTCAATTAA TTAAAAATAA 1200 

GTCAAAATGC ACAACTTTTT ATn 1223 



(2) INFORMATION FOR SEQ ID NO: 5B1: 

(i) SEQUENCE CHARACTERISTICS: 
w (A) LENGTH: 454 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

15 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 581: 
CACCTTTTTA TCATGCTTAG TTATCAATAA ATCTATATTT TGCTGTTTTA CAATTTTTTT . €0 

20 AACTTTATCA ATCTCATTAT CTTGGACTAA ATAAATATAT GATCTTGCAT CTGTTGCTAG 120 
AGCTTGTTCG TGTTTTTCTG ATAAAACATA TGTGATGGAA GCGTGAATAA TAATGCCTAA 180 
TGTAACAAAA CTGATAATTA ATATACTGCT TATCAATAAC ATTAAGCGGT GGTGAAACTT 24 0 

25 CATCATTGTT CTTTAGGTCT TTCCAATTTA TAGCCTAAGC CACGCACAGT TTTAATAAGT 300 
TGTGGCTTCT TAGGATTATC TTCTAATTTA TCTCTTAAAT GACTGATATG TACATCAACA 360 
ATTCTTGAGT CTCCTGCAAA TTCATAATTC CATACCGTAT TTAACATATG CTCTCTCGTA 420 

30 

ATGACTCTGC CTTGTCTTTC TATCAAATAA AGCA v 454 

(2) INFORMATION FOR SEQ ID NO: 582: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 452 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
<D) TOPOLOGY: linear 

40 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 582: 



45 



50 



TTTATAAGAT TTTATTTACA AATAATTGGT 


TTTCATATGT 


ATAAACACTT 


TTGACTTTCA 


60 


AATCTTAACG ATAATTCTAT TACAATACAA 


TCCCCTATTA 


GAATGATTTA 


TGTAATAAAA 


120 


AAAGCGGAGT TTCCCCCAGC TTTTCTAAAC 


GACTACATAA 


AATATAAGAT 


TGCAATTAAA 


180 


TGCAATAGTG ATGCTATTAC AATAAAAATA 


TGCCAAATCA 


TATGAAAATA 


TGGTCTATTC 


240 


TTTTGTGCAT AAAACCATGC ACCAATTGTA 


TAAGACACAC 


CACCTAAGAA 


AATGAATAAT 


300 


ATGAATATCC ATGATGTGCG AATAAAAATA 


ATTGGTAACA 


AGATAATACC 


TACCCAGCCC 


360 
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AAAATCCCCC AAAGTGTCGT TCCCCATAAT AA 452 
(2) INFORMATION FOR SEQ ID NO: 583: 

<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1472 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 583: 

CGCTTTTTGC AATAAGTCAT TAGCCGCTTT TAAGCCTTCT TCTTTTCGAT CTACAACAAG 60 

TAAAATAAAT GGCTTTAACG CTTCTTCTTT TTCACTTTCA AGCATATCTG GTTTTTGAAC 120 

CATTTCAAAT GGAGATTTCA ATCCATTATT ATCGCTCATT TCAATAATTG CATCATACTG 180 

20 TGCTTGTGAC ATACTTGCAA TAGCCTGTTT TGCATTTTCT TGAAGGAAAT ATAAGTTTTT 24 0 

CAATTTAGGA TGCTTATTTA ATGTACTTAA TGTAATCGGT GTAATGTCTT TCTCATAAGA 300 

CACTTCAATC ACTGTACTAT TTGTTCTACC AGGAATTGGT GGTTTTTCAT GAATATGCTT 360 

TGATACTTCT CCAATTCCAA CGACAGATTG ATTTTTCGTT CGATTATAAA AAATAATATT 420 

GTCGCCTTCT TCTAACTGAG TATAAAAATG ATAACCATTA CGTTTAATAC CGTTGTACGT 480 

GTGCGTATAA ATCGTATATT GGTTTCCAGG TTCAAATTCT TCAGTTTCAG CTAAAAAGAA 540 

ATAACGCGGT ATCTTAATTT CGCCTTTACC AAGACCACTT ATTAAATCAA ACTCTTCTGC 600 

AGTGATTTGA TTGAACAATG TCTCTTTCAT ATnACTTATA CGAAATTCCA AAGCTTCACT 660 

ACGCTTTAAA TAATCTGCTG TTAATGGTTT CAATTGTTCA TTAAAACGAA ACTGTACACG 720 

TATTTTATTT TGTGCACCTG TTTCAACACT AATAATTTCA CCACATCCAA GTAGTCCAGT 780 

ATCCGTCTGA ACTTGATAAA AGATGACTTG ATCTCCTACT TTAGCCTTTT TAAACGCTCT 840 

AAATCCTTGA GATGGGTTAA AATGTGCGCC TGATTCAAAT AAAGCTGTTT GTCCTACTAA 900 

CGGTTCATTA TGATTCCAAC GGTTATATCC ACAATTCAAC CAAAAATAAT TCGTTTCTGC 960 

TGTCATCTTA ATACTCCTTA ACCTGAATAA ATTTTAGAAA CACTATGAAT TACATTCTTT 1020 

tAGTGTTTCT TATGCAGTTG GACGCGTATG CGAACAACTG TATACCCTTT GTTCACTGCG 1080 

ATTTTAATCG CATTTCCTAT AACATTGTAG CGCCCAGGAC ATTAATTTAC GTCCCAGACC 1140 

CTTATCGTTT TCACTTCTAA GTAAGTCGAA CTATTITGCT TTACAACAAG TGCGACTCTA 1200 

AATACAGTTG GACACACATA CGAGCAACTG TATACCTTTT AATCAGTTTT CTATATTTTA 1260 

TTTATTATAT CTGTCTTAAT GATAAAAATT GTTACAAACA GTTTAACATA TTTAGCTACC 1320 
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ATGATACCAC TATGCTTGCn TATCTCTATA GCGCCATTGA TACACATTTT TAAATATCTA 1440 
TACTGCCGTT AGAATTTTAT CATGTCTnAA TT 1472 
5 (2) INFORMATION FOR SEQ ID NO: 584: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 787 base pairs 

(B) TYPE: nucleic acid 

10 (C) STRANDEDNESS : double 

<D) TOPOLOGY: linear 



15 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 584: 

GGTAGTGAAT GGGGTTCAAG ACAACAGTAT TGGAAGTACG AATGAATCAC AGTTTTTAGG 60 

AAATTATATT GTAATTAAGC ACGCAGAAAA TGAGTATAGC TTAATAGCTC ATTTACACCA 120 

20 ATATTCAATC ATTGTGAATG AGGGGCAAAA TGTTAAATAT GGTGATATCA TTGGGAAGGT 180 

TGGGAATTCT GGCAATTCTA CTGAACCTCA TATACATTTT CAAGTAATGA ATGATAAGAA 240 

TATTGAAGCA TGTACATCTT TAAAAATTCG ATTTATAAAT AATCGAGAAC TTATCAAAGG 300 

GGATGTGGTC TGCGGATTAC AAGCTGAATG ATGGCGATAC TTATAAAATC TCGACACTAT 360 

AAAAATGGTA TAGTGTCGAG ATTTTCTTGC TTATTTAGTT AATTCAAAGT GCACGCCGGA 420 

TTCATTAGAA GTCGACGTAT TTTTGTTTGT AATAGAGTAA CCGGTCATTG AAATTTTAGA 4 80 

TTCAATATCT GAAGCGGAAT TTGTAGATTC AGGATTATAG AAGCTACATT CATAAGTGTT 540 

ATCATCTTTC TTTTTAAGTA TAAACATACC TTTGGCTTTA ACTTCGACTT TAGTGTTGTT 600 

AATGTCAAAA GTTTGAGTGC TATTACTATA ATTAACACCA GCCCAAACCG ATTCATTATC 660 

TTTCACAACG GGGAAGTCAT CTTCTTGCTT AACGACGTnA CTTCATCTTT CTCTGTCTTA 720 

AAGACATCTT TAGATAAGCC TGGATACAAC ACATATCCAT ATTTATTGTC AGAATTAGAA 780 

40 TGCTTTT f 787 
(2) INFORMATION FOR SEQ ID NO: 585: 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 830 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 585: 
ATGCTAAATT AGGGGGAATA TTTACGATAA AGAGACCAGA AAAATAATAA AACACATGCT 60 
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5 



10 



20 



TAAAATGAAG 


ACTATTTTTT 


ATTACAAGAA 


AATGTATCTA 


GTAAACTTAA 


AGTAGCAAGA 


180 


CCTAATAAAT 


TTAATGCATG 


TTGTGCACCT 


TTTTTACCTT 


GGCCAGCTTC 


GAAATGTTTG 


240 


TAAGCAGCTA 


CACTTAAAAT 


GCCTATCGTT 


GATAGTGATG 


CAAGGCGAGA AATGTTTTTA 


300 


TTGATAAAGC 


TAGCTGAGTA 


TAAAGCAGCA 


GTAGTTGCTT 


CTGCAATGCC 


GACGTATTTT 


360 


ACAAGTTCTT 


TTTGCAAGCC 


AAAAGTATGT 


TCAAACAGTT 


CAATCATACC 


CTTATCTTCT 


420 


TGCAATTTAG 


GTTTACTGGC 


TTGGTATAGC 


TCTTTCGCAA 


GTTTTAAATT 


CGTTGCGTAA 


480 


CGCAAAATCA 


TATTTAATTC 


CTCCCAATAT 


TTGATTTTTT 


GTGAAAGATG 


ATTACTTTAT 


540 


CATTTTTACC 


CGTTTCTATA 


AAAATGAATC 


AATTATGTAA 


CGTATGTGTA 


GTTTAGGAAT 


600 


GTTTGCTATG 


GAAATATAAT 


TCTGTTCACT 


CAAAATGTAT 


GAAATTAATG 


TGTAGTTTTG 


660 


TCGAGTTGCT 


CTTTTAATTT 


GGTTAGATTG 


TTTTTTAGAG 


AAGCGGTACT 


ATTTTTAAGT 


720 


GCATCAACAG 


ATTTACCTTC 


GTTTTGAGAC 


ATTGAGTTTA 


TTACAGCACG 


AAGTTCTGTT 


780 


TCTAGTATGT 


CaGCGTCGCt 


TTAGCATTAG 


AACTTAaTAt 


TTAtAcTCTT 




830 



(2) INFORMATION FOR SEQ ID NO: 586: 

25 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 412 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(Xij SEQUENCE DESCRIPTION: SEQ ID NO: 586: 

35 TTAGGACGTT TTTACAATCA GTACAATGAG CTCATTGTTA TTAGTCCTTT AACGGCGTCT 60 

TTTAATGCTG GCGCTACATT TGGGCGATTT CATCATTTAA TTGATACTGA AACTTTAGCA 120 

AAATTAGAAC ATGAAAAAGG ACATTATTAT CAGAAGATGA TATGTGATGA CAATGTAGAA 180 

40 ATGATTTCTA TAAATAACAT ACCGAAATAT CCGAGAAATC ATAATGTATT AACTAATCAT 240 

GACTCATACG AATATTCATT GAATTTAGGA AGTAGTAATA GTTATTCAAA GTATGAGCTT 300 

ACCTTAGATG ATATTTATGT TGGTGCTACC TTTtAACAAA TTATATTTAT ATTCTAGCCm 360 

45 

ACtAAATAAA AGGGkaCtaT TTGaATCaAA CmATaTGtAT TAACCTTTTT TA 412 
(2) INFORMATION FOR SEQ ID NO: 587: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4709 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 587: 
TTCAGTTTGA AATTAATCAT ATAAATTTCT TATGGGAGGG TTGATATCTT AATGATTAAC 
ATTATTTCAG CTATAGGATC TATTGGAACA TTTATTATGG CTTTATTTTA TTTTGTATCA 
GTTTCAGTTC AACTTTATCA AATGAAAATT AGCTTTCTGC CAGCTTTAGG TTTTAACCAA 
ATTTTATTAG AAAGGGAGGA GGATCAACTT AATATAATGA ATTCGGCAAC AGAAGAGCAT 
CATCATAAAG ATTATATTAA ACTATATAAT TTAGGTGGCG GTGCTGCTAA rAAAATTGCA 
ATAGAGGTTT TATTGGGGAA GGATArAGTC ATTCAGAAAA AATACGTGCA TATTkTACCT 
AGTAAAGAAG GGTACATGTT ACCAATTAAT AAAAATGTGT ACGAAGAATT AGAAAGAACG 
ATTGASAACA ATGGTCATGA AGCTGATTTG AATGTACGTA TGACTTATTA TCATAATGTA 
AGTCGCAAAC AACAGGAAGT TATATTAAAA GGTCAAATCG ACCGTTTTAA TACTTATAAT 
AATAAAGAAA TTTATGATTT GCAGTTTATC TAAAAATTGA TTTAAGAGGG TAGTTGTTTA 
TTGCGAAAAA TATCATTCAA TTTTAATGAA ATAATGGCGT CATTACTATA AAATATTACT 
TTATGTTGTA ATGCATTTTT CTATAAGATA GAACTAAAAG GAGGGGCAAA GATGCAAATT 
AGACAAATAC ATCAACATGA CTTTGCTCAA GTGGACCAGT TAATTAGAAC GGCATTTGAA 
AATAGTGAAC ATGGTTATGG TAATGAATCA GAGCTAGTAG ACCAAATTCG TCTAAGTGAT 
ACGTATGACA ATACCTTAGA ATTAGTAGCT GTTCTTCAAA ATGAAGTTGT AGGGCACGGT 
TTACTAAGTG AAGTTTATCT TGATAACGAG GCACAACGGG AAATTGGATT AGTGTTAGCA 
CCTGTATCTG TTGATATTCA TCATCAAAAT AAAGGTATTG GGAAGCGATT GATTCAAGCA 
TTAGAACGAG AAGCAATATT AAAAGGATAT AATTTTATCA GTGTATTAGG ATGGCCGACG 
TATTATGCCA ATCTAGGATA TCAACGCGCA AGTATGTACG ACATTTATCC ACCATATGAT 
GGTATACCAG ACGAAGCGTT TTTAATTAAA GAATTAAAAG TGAACAGTTT AGCGGGAAAA 
ACAGGTACCA TAAATTACAC ATCTGCTTTT GAAAAAATAT GATTTCAAGC TAGGATTACA 
TTAGGTAGAG TTCATATTAA TAATAAAAAA TGTTTGCAAT CAAATCGTAC GTTGTCGTTT 
GTAATTCTTA AAATAGCAAT AAATAAAATG TTTGTTAGTA AAGTATTATT GTGGATAATA 
AAATATCGAT ACAAATTAAT TGCTATAATG CAaTTTTAGT GTATAATTCC ATTGACAGAG 
ATTAAATATA TCTTTAAAGG GTATATAGTT AATATAAAAT GACTTTTTAA AAAGAGGGAA 
TAAAATGAAT ATGAAGAAAA AAGAAAAACA CGCAATTCGG AAAAAATCGA TTGGCGTGGC 
TTCAGTGCTT GTAGGTACGT TAATCGGTTT TGGACTACTC AGCAGTAAAG AAGCAGATGC 
AAGTGAAAAT AGTGTTACGC AATCTGATAG CGCAAGTAAC GAAAGCAAAA GTAATGATTC 



1519 



EP0 786 519 A2 



GTCAAACACT AATAATGGCG AAACGAGTGT GGCGCAAAAT CCAGCACAAC AGGAAACGAC 1800 

ACAATCATCA TCAACAAATG CAACTACGGA AGAAACGCCG GTAACTGGTG AAGCTACTAC 1860 

5 

TACGACAACG AATCAAGCTA ATACACCGGC AACAACTCAA TCAAGCAATA CAAATGCGGA 1920 

GGAATTAGTG AATCAAACAA GTAATGAAAC GACTTCTAAT GATACTAATA CAGTATCATC 1980 

TGTAAATTCA CCTCAAAATT CTACAAATGC GGAAAATGTT TCAACAACGC AAGATACTTC 2040 

10 

AACTGAAGCA ACACCTTCAA ACAATGAATC AGCTCCACAG AGTACAGATG CAAGTAATAA 2100 

AGATGTAGTT AATCAAGCGG TTAATACAAG TGCGCCTAGA ATGAGAGCAT TTAGTTTAGC 2160 

15 GGCAGTAGCT GCAGATGCAC CGGTAGCTGG CACAGATATT ACGAATCAGT TGACGAATGT 2220 

GACAGTTGGT ATTGACTCTG GTACGACTGT GTATCCGCAC CAAGCAGGTT ATGTCAAACT 2280 

GAATTATGGT TTTTCAGTGC CTAATTCTGC TGTTAAAGGT GACACATTCA AAATAACTGT 2340 

20 ACCTAAAGAA TTAAACTTAA ATGGTGTAAC TTCAACTGCT AAAGTGCCAC CAATTATGGC 2400 

TGGAGATCAA GTATTGGCAA ATGGTGTAAT CGATAGTGAT GGTAATGTTA TTTATACATT 2460 

TACAGACTAT GTAAATACTA AAGATGATGT AAAAGCAACT TTGACCATGC CCGCTTATAT 2520 

25 

TGACCCTGAA AATGTTAAAA AGACAGGTAA TGTGACATTG GCTACTGGCA TAGGTAGTAC 2580 

AACAGCAAAC AAAACAGTAT TAGTAGATTA TGAAAAATAT GGTAAGTTTT ATAACTTATC 2640 

TATTAAAGGT ACAATTGACC AAATCGATAA AACAAATAAT ACGTATCGTC AGACAATTTA 2700 

30 

TGTCAATCCA AGTGGAGATA ACGTTATTGC GCCGGTTTTA ACAGGTAATT TAAAACCAAA 2760 

TACGGATAGT AATGCATTAA TAGATCAGCA AAATACAAGT ATTAAAGTAT ATAAAGTAGA 2820 

35 TAATGCAGCT GATTTATCTG AAAGTTACTT TGTGAATCCA GAAAACTTTG AGGATGTCAC 2880 

TAATAGTGTG AATATTACAT TCCCAAATCC AAATCAATAT AAAGTAGAGT TTAATACGCC 2940 

TGATGATCAA ATTACAACAC CGTATATAGT AGTTGTTAAT GGTCATATTG ATCCGAATAG 3000 

40 CAAAGGTGAT TTAGCTTTAC GTTCAACTTT ATATGGGTAT AACTCGAATA TAATTTGGCG 3060 

CTCTATGTCA TGGGACAACG AAGTAGCATT TAATAACGGA TCAGGTTCTG GTGACGGTAT 3120 

CGATAAACCA GTTGTTCCTG AACAACCTGA TGAGCCTGGT GAAATTGAAC CAATTCCAGA 3180 

45 

GGATTCAGAT TCTGACCCAG GTTCAGATTC TGGCAGCGAT TCTAATTCAG ATAGCGGTTC 3240 

AGATTCGGGT AGTGATTCTA CATCAGATAG TGGTTCAGAT TCAGCGAGTG ATTCAGATTC 3300 

5Q AGCAAGTGAT TCAGACTCAG CGAGTGATTC AGATTCAGCA AGCGATTCCG ACTCAGCGAG 3360 

CGATTCCGAC TCAGACAATG ACTCGGATTC AGATAGCGAT TCTGACTCAG ACAGTGACTC 3420 

AGATTCCGAC AGTGACTCAG ATTCAGATAG CGATTCTGAC TCAGACAGTG ACTCGGATTC 3480 

55 



1520 



EP0 786 519 A2 



5 



10 



15 



30 



35 



CGATTCTGAC 


TCCGACAGTG 


ATTCCGACTC 


AGACAGCGAT 


TCAGATTCCG 


ACAGTGATTC 


3600 


CGACTCAGAT 


AGCGATTCCG 


ACTCAGATAG 


CGACTCAGAT 


TCAGACAGCG 


ATTCAGATTC 


3660 


AGACAGCGAT 


TCAGATTCAG 


ATAGCGATTC 


AGATTCCGAC 


AGTGACTCAG 


ATTCCGACAG 


3720 


TGACTCGGAT 


TCAGATAGCG 


ATTCAGATTC 


CGACAGTGAC 


TCAGATTCCG 


ACAGTGACTC 


3780 


AGACTCAGAC 


AGTGATTCGG 


ATTCAGCGAG 


TGACTCGGAT 


TCAGATAGTG 


ATTCCGACTC 


3840 


CGACAGTGAC 


TCGGATTCAG 


ATAGCGACTC 


AGACTCGGAT 


AGCGACTCGG 


ACTCAGATAG 


3900 


CGATTCGGAC 


TCAGATAGCG 


ATTCAGAATC 


AGACAGCGAT 


TCAGATTCAG 


ACAGCGACTC 


3960 


AGACAGTGAC 


TCAGATTCAG 


ATAGTGACTC 


GGATTCAGCG 


AGTGACTCAG 


ACTCAGGTAG 


4020 


TGACTCGGAT 


TCATCAAGTG 


ATTCCGACTC 


AGAAAGTGAT 


TCAAATAGCG 


ATTCCGAGTC 


40B0 


AGTTTCTAAC 


AATAATGTAG 


TTCCGCCTAA 


TTCACCTAAA 


AATGGTACTA 


ATGCCTCTAA 


4140 


TAAAAATGAG 


GCTAAAGATA 


GTAAAGAACC 


ATTACCAGAT 


ACAGGTTCTG 


AAGATGAAGC 


4200 


AAATACGTCA 


CTAATTTGGG 


GATTATTAGC 


ATCAATAGGT 


TCATTACTAC 


TTTTCAGAAG 


4260 


AAAAAAAGAA 


AATAAAGATA 


AGAAATAAGT 


AATAATGATA 


TTAAATTAAT 


CATATGATTC 


4320 


ATGAAgnAAc 


rCCTTAAAAG 


GTGGCTTTTT 


TACTTGGATT 


TTCCAAATAT 


ATTGTTTGAA 


4380 


TATAATTAAT 


AATTAATTCA 


TCAACAGTTA 


ATTATTTTAA 


AAAGGTAGAT 


GTTATATAAT 


. 4440 


TTGGCTTGGC 


GAAAAAATAG 


GGTGTAAGGT 


AGGTTGTTAA 


TTAGGGAAAA 


TTAAGGAGAA 


4500 


AATACAGTTG 


AAAAATAAAT 


TGCTAGTTTT 


ATCATTGGGA 


GCATTATGTG 


TATCACAAAT 


4560 


TTGGGAAAGT 


AATCGTGCGA 


GTGCAGTGGT 


TTCTGGGGAG 


AAGAATCCAT 


ATGTATCTAG 


4620 


TCGTTGAAAC 


TGACTAATAA 


TAAAAATAAA 


TCTAGAACAG 


TAGAAGAGTA 


TAAGAAAAGA 


4680 


TTGGATGATT 


TCAATATGGT 


CCnTTCCCA 








4709 



(2) INFORMATION FOR SEQ ID NO: 588: 

40 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1554 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

45 

<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 588: 
CTTTTCTAAt TAwCgGaAtA TTGtCaTgaT tAcAcTTCGt TAGGGTTTAc gTCGtAATTT 60 

50 

CATTTaaTAA gCgCTTCAcC ATTAAAtGTG gTAmCCTTTA ACTCGCCAGT AGAAACATCA 120 
CAGTAACTAA GCGCAATCTC AGGTTGATTC ATAACAAAAC TTAAAATATA GTTATTTTGT 180 
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1S 



20 



CGTCTAACCA TACCTTTCGT TTGTTTCGGA TCTTCCATCT GTTCACAAAT AGCTACTTTA 


300 


TATCCATTAT 


TAACAAGTGT ATCTATATAA CTATCTGCAG AATGATACGG AACACCACAC 


360 


ATCGGAATTG 


GATTTTCTTT TTTAGCATCT CTTTTAGTTA AAGTAATTTC AAGTAyACGT 


420 


GATGCCTCCT 


TGGCATCTTC ATAAAACATT TCATAGAAAT CACCTAGTCT AAAAAATAAT 


480 


AAGCAATCTT 


GGTATTCTGA TTTTATTTTT AAATATTGCT GCATCATTGG TGTAACATTA 


540 


GACATATTAT 


TTCTTCACAA CCCTTGTCTC TTTTTAAAAT TTGTCTTTAC AATATATTCG 


600 


TTTGTAAGyT TTTTAATTAT TAATTATTTA ACTTATACAT TTTAACATAC TTACTTTTAC 


660 


AAACCTATTC 


ATACCATATA ATCACGAAGC ATCTTAAATG TATAAGAAAA CGCCTCAAAC 


720 


CTAATAAAAT 


GTGTCAATAG CATGTTTAGA ATTAAATTAA AATTCTAACA TTCAAGACAT 


780 


TTAATTAAGT 


AAGGGCGTTC AATATTAAAA TGAACAATGA CTCTGTTTGA AATCATATAT 


840 


CATAAAATTA 


TTTTATAAAC CTTTGAAGAA TACCACGTTT TTTTAGAGTA ATTAATAAGA 


900 


AATAACTTAT 


AATAGATCCG ATAGCACTTG aGACTATGaA CGTAATCATT AACGGTTTAA 


960 


TGAAGAAGTC 


TTGAAGCCCA AGGaAATATG CTAATGGtAT aCaAATTAAA cTTCCgATGA 


1020 


CaCCAGTTCC 


aAGTACTTCa CCGACCGCGG CCaTAAATAT ATGTTTACGA TATnygTAAA 


1080 


ACATACTAGC 


CAATAAAACT CCAATCATAC TACCCGGAAA TGCAAAAGst GTACCAGTAC 


1140 


CAAAAAGAAC 


TCTTAAAATT GATGATATAA GCGCTTGAGC TAATCCATAC CAAGGACCTA 


1200 


CTATGACCGC 


ACTTAATACA TTTACAAAAT GCTGTACTGG TGCTGCCTTA ACTGGTCCTA 


1260 


GAGGAATGAT 


GATAATACTG CTTAATACAA CATTTATTGC AATTAAAAGT GCAGTTATAG 


1320 


CCAGTTTTCT 


TGATTTCATA TGATTGTTCT CCTTTTTGTT TGTAATTAAT CACTATGCTT 


1380 


GGCTTTATTA 


TGGTCATTTA AACGTGTTTC CATTGTTGAT ACAAACATTT TCAATAATTG 


144 0 


ATTCGCTTCA 


TATTGTGAAG TTTGAAACTG TTCAACTATG GGCAATGTAT TTATTTCTGC 


1500 


TTCTAtACTC 


TGAATGGtAT GTTCCGACTG nTCCAGCGCA TTTGTTTCCC GnAA 


1554 


(2) INFORMATION FOR SEQ ID NO: 589; 





<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 638 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



so 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 589: 
TTTTGACGAA AAAAGTTGAT TTACAAATAT ATAAACGTTG TGATTTCAAT GTTTGTATAG 60 
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TATATACATG ACAGCAACTT GGGAAAAAAA GGAAGGTAAC GAAGGTTTAT TAACTGTTAC 180 

TGTTCCTGCA GAAAAAGTAA ACAAAGCrCT GAGAGATCCC CTCATAATTT CCCCAAAGCG 24 0 

TAACCATGTG TGAATAAATT TTGAGCTAGT AGGGTTGCAG CCACGAGTAA GTCTTCCCTT 300 

GTTATTGTGT AGCCAGAATG CCGCAAAACT TCCATGCCTA AGCGAACTGT TGAGAGTACG 360 

TTTCGATTTC TGACTGTGTT AGCCTGGAAG TGCTTGTCCC AACCTTGTTT CTGAGCATGA 420 

ACGsCCGCAA GCCAACATGT TAGTTGAAGC ATCAGGGCGA TTAGCAGCAT GmTATCAAAA 480 

CGCTCTGAGC TGCTCGTTCG GCTATGGCGT AGGCcTAGTC CGTAGgCAGG ACTTTTCAAG 540 

TCTCGGAAGG yTTCTTCAAT CTGCATTCGC TTCGAATAGA TATTAACAAG TTGTTTGGGT 600 

GTTcGAATTk CAACArGTaA GTtAGtTGCT AGAnCCCA 638 
(2) INFORMATION FOR SEQ ID NO: 590: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 1242 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 590: 

AAAATATTCC CGTACATTTT GATGTCTGTA GGGGCTTTTT TGACTTTAGG ATTTGTCATT 60 

TTTTCAATTC ATAAAGGGAG ACGAACGAAA AATGAATCAG CACGTAAAAG TAACATTTGA 120 

TTTTACTAAT TATAATTACG GCACATATGA CTTAGCAGTA CCAGCATATT TACCGATAAA 180 

AAACTTAATA GCTTTAGTAT TGGATAGTTT GGACATTTCA ATATTTGATG TCAATACACA 24 0 

AATTAAAGTG ATGACGAAAG GTCAATTACT TGTTGAAAAT GATCGACTCA TTGATTATCA 300 

AATCGCTGAT GGAGATATTT TGAAGTTACT ATAGGAGGGA AAATAGATGG TTAAAAATCA 360 

TAACCCTAAA AATGAAATGC aAGATATGTT AACGCCTTTA GATGCTGAAG AAGCAGCTAA 420 

AACAAAATTA CGCTTAGATA TGAGAGAGAT TCCTAAGTCT TCAATTAAAC CAGAACATTT 480 

TCATTTAATG TACTTATTAG AACAACATTC TCCATATTTT ATAGATGCTG AATTAACTGA 540 

45 ACTACGTGAC aGTTTCCaAA TACATtATGA CATTAATGAc AATCATACAC CTTTTGATAA 600 

TATTAAATCA TTTACTAAAA ATGAAAAATT ACGTTACTTA CTCAATATCA AAAATTTAGA 660 

AGAAgTAAAT CGTACACGCT ACACATTTGT GTTGGCACCA GATGAATTAT TTTTCACAAG 720 

50 

AGATGGATTA CCCATTGCTA AAACAAGAGG GTTACAAAAT GTTGTTGATC CATTACCTGT 780 

GTCAGAAGCT GAATTTTTAA CAAGATATAA AGCGCTGGTT ATCTGTGCAT TCAATGAGAA 840 
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AACTAAAGTT ATTGAAGCGG CAACGTTAGA TTTACTAACG GCATTTTTAG ATGAACAGTA 960 

TCAGAAACAA GAACAAGATT ATAGTCAAAA TTATGCATAT GTACGCAAAG TAGGACATAC 1020 

5 

CGTTTTCAAA TGGGTTGCTA TCGGTATGAC AACGTTAAGT GTTTTATTAA TTGCATTCTT 1080 

AGCCTTTTTA TATTTTTCAG TAATGAAGCA TAATGAGCGC ATTGAAAAAG GATACCAAGC 1140 

ATTTGTAAAG GATGtTATAC GCAAGTACTA AATACGTATG ATGATTTAGA TGGTaAAAAt 1200 

10 

TgaTAAAGAG GCACTTTACA TTTATGCCAA AAGTTATATC CA 1242 

(2) INFORMATION FOR SEQ ID NO: 591: 

, 5 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 744 base pairs 
<B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

20 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 591: 



25 



35 



TTCCAGATAG 


AGCCTTAGTT 


GCTGCCGCTG 


AATTGTCTGA 


TCGTTACATC 


ACTGATCGTT 


60 


TTTTTACCAG 


ATAAAGCGAT 


TGATTTAGTT 


GACCAAGCAT 


GTGCAACAAT 


TCGTACGGAA 


120 


ATGGGATCAA 


ATCCAACTGA 


ATTGGATCAA 


GTTAATAGAC 


GTGTCATGCA 


ATTAGAAATT 


180 


GAAGAAAGCG 


CACTTAAAAA 


TGAATCTGAC 


AATGCGAGCA 


AACAGAGATT 


ACAAGAACTA 


240 


CAAGAAGAGC 


TTGCCAATGA 


AAAAGAGAAA 


CAAGCAGCAC 


TTCAATCTCG 


TGTAGAATCA 


300 


GAAAAAGAAA 


AAATAGCAAA 


TTTACAAGAA 


AAACGTGCGC 


AACTAGATGA 


AAGTAGACAA 


360 


GCGTTGGAAG 


ATGCACAAAC 


AAATAACAAT 


TTAGAAAAAG 


CTGCTGAACT 


ACAATATGGA 


420 


ACAATTCCTC 


AATTGGAAAA 


AGAACTTAGA 


GAATTAGAGG 


ATAATTTCCA 


AGATGAGCAA 


480 


GGTGAAGATA 


CAGATCGAAT 


GATTCGTGAA 


GTTGTAACAG 


ACGAAGAAAT 


TGGCGATATT 


540 


GTCAGCCAAT 


GGACAGGCAT 


ACCAGTTTCA 


AAATTAGTTG 


AAACAGAACG 


TGAAAAATTA 


600 


CTTCACTTAA 


GTGACATCTT 


GCATAAACGT 


GTTGTAGGTC 


AAGATAAAGC 


GGTTGACCTG 


660 


GTTTCAGATG 


CAGTAGTTAG 


AGCAAGAGCA 


GGTATTAAAG 


TnCAAACAGA 


CCTATTGGTA 


720 


GTTTCTnATT 


CCTAGGTCCn 


ACTG 








744 



(2) INFORMATION FOR SEQ ID NO: 592: 

(i) SEQUENCE CHARACTERISTICS: 
50 (A) LENGTH: 144 9 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 592: 

TTGTTATAGT GTCTGAATCT GTGTAACTCT TGCCCATGTG TTCTGAGTAA AGCACCCACT 60 

GTTTATTTAC TTTTCGTTGT AGTCTAGCTT CGTGTAGTAG TTTGTTTAAC TTTTGTGCTG 120 

ATATACCGTA GTCTGCCGCG ATTTGAGTTG TGGCTAATGT GCCAGTTGAT TTTAAGATTT 180 

CATCAACATA ATCTGCTTTG GGTTTTAGCT CTCCAATTTC TTGTTGTAAA AGTAAGTTTT 240 

GCTCTTTTTC TTTCTTATAC TCAGTCAACA CTGTAATGAT GTAGTCTGGA TCTTTTAATG 300 

TTTGTTCAAT TACATTGTCT GTTGCGTATA TACCGTGTTT GCGAATAGCT GGTaGGACAT 360 

CTGATGTTAC CCAGCGTTTG AATTTTCTAG CGGTTTCTCT AATTTTTTCG TTTTTGCTTT 420 

GTTTAGAAGC ATCGAAGATT AGACTGTATA ATCCTGATTC GTTGATAATG ATCATATTTC 4 80 

TGTTTTGACC TGATGCACTA AATTGGTGCG TCAGTTTGTC CTCGCTATCA ACATGATTTC 540 

20 TAATGGCATT GTCTGATCTT GCATATCCTA AAATCTCAGC AATATCTTTT CCTACAAAAT 600 

AAGGTTCGTT TTCAATTTCT ACTGTTCTTA CTGGTAGCTC TTTAAAATTA AATGTTTGTA 660 

ATGCTTGCAT TTGAGTATCC TCCTTTTTCC TCAACACCCA CATTCAGCAG ACGGTTATCG 720 

25 CAATGACTAT CGAATGTATT TAAACGCGGC TCATATCATC GCCAGcTCTC GCTCACATCT 780 

GCTCAATGTG GATGTTGATA AGCGTGGTTA TATTAAGAAG TGAATGTTAC TGATTCACTT 640 

TCCGCCACTC TGTTAAATCA GTAACTTTGT TATCGCTTTC AACACCGTTA AGCTTGTCTA 900 

ACGCTTTCAC TACTTTTTGG AACTCTTTGA TAGCACTtCG TAGCTTTTTA GTAATTTCAT 960 

CTTCTACCAT TTCCAAACCA GCAAATGCGT CTTCGTTATT CATGCTTAGA TGTTTGTTGA 1020 

AAAGATCTCG AGTGTATCTT ATTTCTTTAA GTGATTTATC ATAAGCTTCA ATTTGTCCTG 1080 

AAAGGTTATG ATATTTTAGT TGTAGTTTTA CTAATTTTAA TGATTGGTCT TGCATTTGTT 1140 

ATGTCTCCTT TAAGATGTTT GTTTGCGTTT CGTGTACTTT GTGGGTAAAA AAATATCTCC 1200 

AATATTTTCG TCAAAAAAAT CAGCGATAAT AAACATCTCA TCATTCTTAA ATTGATGCTT 1260 

TCCTAATTCT TTTAAACGAT AACCTTCAGT TGATATATTC AAGAGGTTTG CTAAATCTTC 1320 

TTGAGTACAC TTTCTTTCTT TTCTCAACTT TATTAAATTC CATTGCATGT TGTCACCTCC 1380 

45 CGCTTTACAA AACCTACTAT ACACGATACG GTACTTGnGT CAACATAAAA GTTTGCTTTT 1440 

CGTGTATTT 1449 
(2) INFORMATION FOR SEQ ID NO: 593: 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1170 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
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<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 593: 



75 



20 



35 



40 



ACCAAAAACA 


CTTTCTAAAG 


AAATTGTTTC 


AGAACCATTT GCTAAAAACC AATTACGTGA 


60 


AAAAGCTCGT 


CTAACTAACA 


TTAAAGGTTT 


AGAGATTCCA AGAGTTTCAT ACACTTTAGA 


120 


CGATGATGAT 


TTCATTACAG 


ACGTAGAAAC 


AGCAAAAGAA TTAAAAGCAA AAGGTGATAC 


180 


AGTCAAGTTC 


ACTACTAATA 


AATTCAAAGT 


ATTTGCTGCA ATTTCAGATA 


CTGTAATTCA 


240 


TGGATCAGAT 


GTAGATTTAG 


TAAACTGGGT 


TGAAAACGCA 


CTACAATCAG 


GATTAGCAGC 


300 


TAAAGAGCGT 


AAAGATGCCT 


TAGCAGTAAG 


TCCTAAATCT 


GGATTAGAAC 


ACATGTCATT 


360 


TTATAATGGA 


TCTGTTAAAG 


AAGTTGArGG 


AGCAGACATG 


TATGATGCTA 


TTATTAACGC 


420 


TTTAGCAGAT 


TTACATGAAG 


ATTATCGTGA 


TAACGCAACA 


ATTTATATGC 


GATATGCAGA 


480 


TTATGTCAAA 


ATTATTAGTG 


TTCTTTCAAA 


TGGAACAACA AATTTCTTTG 


ACACACCAGC 


540 


AGAAAAAGTA 


TTTGGCAAAC' 


CAGTAGTATT 


TACAGATGCA GCAGTTAAAC 


CTATTGTGGG 


600 


AGATTTCAAT 


TATTTTGGAA 


TTAACTATGA 


TGGAACAACT 


TATGACACTG 


ATAAAGATGT 


660 


TAAAAAAGGC 


GAATATTTGT 


TTGTATTAAC 


AGCATGGTAT 


GATCAGCAAC 


GTACATTAGA 


720 


CAGTGCATTC 


AGAATTGCAA 


AAGCAAAAGA 


AAATACAGGt 


CCATTACCCA GCTAAGCCCC 


780 


AAAAGGTTAA 


TGTAACAGCT 


AAGGCTAAAT 


CAGCTGTAAT 


ATCAGCCGAA 


TAGGGGTGAT 


840 


GAAATGAGTT 


TAGAAGAAAk 


TAAATTGTGG 


TTGAGAATTG 


ACTATAATTT 


CGAAAATGAT 


900 


TTAATTGAAG 


GTCTCATTCA 


ATCGGCTAAG 


TCTGAATTAC 


TATTAAGTGG 


GGTnCCAGAT 


960 


TATGACAAAG 


ATGACTTGGA 


ATACCCGCTT 


TTTTGTACAG 


CGATTAAATA 


TATCATTGCA 


1020 


AGAGATTATG 


AAAGTCGTGG 


ATACTCAAAT 


GACCAATCTA 


GAAGCAAGGT 


GTTTAATGAA 


1080 


AAAGGATTGC 


AAAAAATGAn 


TTTGAAATTA 


AAAAAGTGGT 


AGGTGATTTT 


TAAATGGAAT 


1140 


TTAATGAATT 


TAAAGATCGC 


GCGTATnTTT 








1170 


{2) INFORMATION FOR SEQ ID NO: 594: 









(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1393 base pairs 
45 (B) TYPE: nucleic acid 

<C) STRANDEDNESS: double 
(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 594: 
TGAAGGGTGT TTTGTTTATG GCCAATTGCT GTGTTATTAA AnCGAATGTT TCGAATGGAA 60 
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ATCATTCCGG AAGAGGACAT GTCTTCAGCT TCTGATTTGA AAGCACAGTT TTATCGCGGT 180 

ACTTTGCAGC GCTTTTACCA AtCnTTGCAC GCAGAAAAGC TTACACCTTA TGTTATGTCT 240 

5 TATGACGATA TCATTTCATT TTGTAAAGAA AACAATATCT CTGAAGTAGT GACTGCGGGT 300 

GATATTATGA GTTATCATCT TGAAGAATAT GATATTTTAC ATCAACGTTC TTTATTCAAT 360 

GAAGCACGCA TTGCCGTTAC TTTGATACGT GGGAATCATT ACTTTAAAGC GAGTAAAACA 420 

10 

ATGAATCAAC AAGGGGAGCC ATACAATGTT TTTACTAGTT TCTATAAAAA ATGGCGACCT 480 

TACTTGAGGC ATAGAGACGT ATATCACTAT GATTTAAAAT CATTCGAAAA CTTTGTCATT 540 

^ GCATCACCTG ATGATTTAGT GTTTGATGAC ATAGCATTTG GATCCTCACA aATAATTGAA 600 

CAGatAAATG GCAACATTTT TTAGATCAAG ATATACAGAA TTACGAAAGC GGAAGAGACT 660 

ATTTACCTGA AGTATTAACA AGTCAGCTAA GTGTTGCTTT AGCATATGGA TTATTAGATA 720 

20 TTATTGAAAT TTTTAATGAT TTATTGGCGC GTTATGATGA AGATGAGGCA AACTATGAAG 780 

CATTTATACG TGAACTCATT TTTAGAGAAT TTTATTATGT GTTAATGACA CAGTATCCTG 840 

AAACCTCATA CCAAGCTTTC AAACCTAAAT ATCGACAGAT AAAATGGTCG CAAAATGAAG 900 

25 CGGATTTTAA TGCATGGTGC GAAGGGCAAA CAGGATTTCC AATCATTGAT GCAGCAATAA 960 

TGGAATTGAC ACAAACTGGT TTTATGCATA ATCGAATGAG AATGGTTGTG TCGCAATTTT 1020 

TAACCAAAGA TTTATTTATA GATTGGACAT GGGGAGAAAA ATTCTTTAGA AAGCACCTTA 1080 

30 

TTGACTATGA TGCAGCATCA AATATTCATG GATGGCAATG GTCTGCTTCT ACAGGTACGG 1140 

ATGCAGTGCC GTATTTTAGA ATGTTTAATC CAATAAGACA GAGTGAACGC TTTGATGCTA 1200 

AAGCTTTGTA TATCAAAACA TATCTTCCGA TTTTTAATCA AATTGATGCA AAATATTTGC 1260 

35 

ATGATACACA ACGCAATGAG TCCAACCTTT TTGAACAGGG GATTGAATTA GGTAGTCATT 1320 

ATCCAAGACA AATGGTAGAT CATCAAGAAA AACGTACACA AGTTTTAGCT ACATTTAAAG 1380 

40 CGCTAGACTA ATT 1393 

(2) INFORMATION FOR SEQ ID NO: 595: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1484 base pairs 
45 (B) TYPE: nucleic acid 

<C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 



so 

<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 595: 
TTAACTTGAA AGATTTCCCC GACATCTATA ACTTGTATAA TGTCTATATG TC G TTTTTAG 60 
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AAAAATTAAA 


AAAAGAATAT 


CTTGATTGGT 


ATAATCAGAC 


CTTAGAGTTT 


TCTAATTTAT 


180 


CAAACAATGT 


AGTAAGwATA 


GATACTCCTT 


TTAAAGATAA 


TTCTTTAGAT AATTTAATAA 


240 


TTTACGCTTT 


ATACGATCAG 


TCCAGAGACA 


TGATTACACT 


GACAGATGAC 


GGCTATACTA 


300 


TATtTGATTT 


AGAAAATAAT 


GGTATTTCTT 


TAAATAAATC 


AAAAAAACGT 


AAAAAGATTT 


360 


TTGAAGAGCA 


CCTTTCAGCT 


TACGGTATTA 


AATATAACGA 


TAAAACTCAC 


GAAATTTTTG 


420 


TTCAAACTAA 


CTTTAAAAAT 


TTTAATAAAT 


CGAAACATAA 


TTTATTACAG 


TGCCTTATAT 


480 


TTGTTAATGA 


TATGTACTTA 


CTTTcTAATC 


CTAAGTCACA 


GAACATATTT . ACAGAAGATG 


540 


TTGCAAACAA 


ATTGGATGAA 


CATAACATTT 


ATTACGGAAG 


AGATTTACCT 


ATTATAGGAA 


600 


GCAGTGGTGT 


TGTTCATAAT 


TTCGACTTTT 


TTATTAGCGC 


TAAGAAAAAT 


CAAAAAGAAA 


660 


AATTTATCAA 


TGCTATTTCT 


AACCCTAATA 


ATTCTATGAT 


TATTAAGTCG 


AAAATAACGG 


720 


ATGCTATGCA 


AGCAAAAAAA 


ATAAAAAGAC 


ACAGGCAAAA 


TGAGTTTATT 


TTTATTTTAA 


780 


ATGACTCAAA 


AAAAGAAATA 


AATGAACATA 


ATAAAAATCT 


TCTTCATGAA AACTATATTA 


840 


GTACAATAGA 


TTATAGCGAA 


TTAGATGAAA 


AGATAGGTTT 


ATTGATTTAA 


TATATATAGA 


900 


CGTGATAATA 


TCAATGTTTA 


TATTAAATGA 


AACGAATTTG 


AAAATTTCGA 


AACAGCTTAA 


960 


GATAGCAAAT 


TGAATAGCCT 


TATTGATAAT 


GGAGAATCGT 


CTACACTTAG 


TTGAACAAAT 


1020 


TCTATGAGAA 


TAGATATTGT 


TAAAGTATTT 


GGGTAGGCGA 


TTTTATTTTG 


ACAAGAGTCA 


1080 


GAAGATTATT 


TAGTTCATAG 


TTTAAGTTAC 


AAATGGCTAA 


ACTTTATGAA 


AATGGTATGA 


1140 


CTAGAATCGA 


AATTATACTC 


GAATACGATT 


TAACACTCTC 


AATCTTCTCG 


AACTGAATAA 


1200 


ATACTGGGTC 


ATTCAATCAT 


CAAGACAACT 


TAATAAGTGA 


TGATAAATGT 


TCATACCATT 


1260 


TTGCAAATAT 


AACCAGATAC 


TCTCAACAAA 


ATGTAGAGTT 


CAAAATTAAA 


AATGTGCCTA 


1320 


ATTGGCACAT 


TGCTGTATGA 


TAATAAATTC 


AACTTAGATT 


TCAACAATAT 


AACTAATGAT 


1380 


GCTTATATTT 


ACCGCGATAT 


CAAACCAAAC 


AGCCCATCCA 


CAAACAAATT 


AGAATATATC 


1440 


TnTGTTAATAA 


TAGTAAATGA 


TATATCTTCC 


AAAGACCGCA 


AACT 




1484 



(2) INFORMATION FOR SEQ ID NO: 596: 

45 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1435 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY; linear 

so 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 596: 
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CTTTATCaTT 


AAATGCCaTT 


TTGaATCCTT 


CTTGAATTTG 


TTTGATTTCC 


TTTTCAGTAT 


120 




TATTAACCTT 


GTTCAAGACA 


GTGCCATTAA 


TTTTCTTCTT 


GAGTGGACCA 


ACCTCATCTT 


180 


5 


TATTAGTTGA 


TTCATGAATC 


GTTAATCCAA 


TGTGTGGCTG 


TATTCTATAA 


CCATCATTCG 


240 




CTATAGTTGA 


AACATATTGT 


GaTAATTGTA 


ATGGTGTATA 


GGTATCATAT 


TGACCAATTG 


300 


10 


ATAAATCTAG 


ATAATTACCT 


GGATTATTTG 


TTAATGGTTC 


GATTTGACCT 


CTTGTTTCAT 


360 


TTGGTAAATC 


TATCCCTGTT 


TTCACACCTA 


AGCCTACTTG 


ATTTAATCCT 


CTTCTTAGCT 


420 




TTTGGGCAGG 


TGAACTTATG 


TCTGAAGGTA 


AAGCCATACC 


AGAATAATAA 


GGGTCTCCCG 


480 


15 


CTAATTTTAA 


TGCTGTTTTA 


AACATATATA 


CGTTTGATGA 


ATGCATCAAA 


GCTTGCTTAT 


540 




CATTAATAGT 


TACATGCCCG 


TTTTTATTGA 


AGTATGATCG 


TTTTGTCAAA 


CCACCTTGGA 


600 




AATGTAATGG 


TTCATCGACC 


ATTGTTTCTC 


CAACTTTGAT 


AGCTTTATTC 


TGATAACCGG 


660 


20 


CTAATAATGT 


TCCACCTTTT 


ACAGAAGATC 


CAACCGCAAA 


TTGAGAAGTA 


AACGTACCAA 


720 




TGTCATAATC 


AGTCATTTTA 


CCACTCTTAT 


TAATCTGCTT 


TCCGGCAAGC 


GCAAGAATGT 


780 




CTCCATTTTT 


AGGATTTTGT 


ACAACCATCA 


TTGcATTATC 


CATATCTTTG 


GCACCTTGAC 


840 


25 


TGCGAsTTCT 


TAATTTGTTT 


ATCTAATAAT 


GCTTCTACTT 


cittttgaag 


ATCTATATCG 


900 




ATCGTTAATT 


TCAAATCTTG 


ACCGCGAGCG 


CCAGGrTTTA 


ACACTTCTGA 


AGATGTAACT 


960 




TTACCAGATT 


TGTCCGTTGT 


GTATTTCATT 


TCTTTCTTCT 


TACCACGeAA 


TACATCTTCA 


1020 


30 


TATTGATATT 


CTAGGTAAGA 


TTTTCCAACA 


CGATCATTGC 


GTGAATATCC 


TTTGGATAAG 


1080 




TAATGTTCTG 


TCAATTGTTT 


TGGaATACCT 


TCAGCAGGTG 


TCGATACATC 


TCCGAATATA 


1140 


35 


CCTCTTAAAG 


TATCGCCATA 


TGGATATTTT 


CTATCCCAAT 


CCATAGACGT 


GTTAACACCT 


1200 


GGTAATTTGG 


AAAGTTGCTG 


AGAAACTGCT 


GCATACTCTT 


TTTCACTGAC 


ATCTTCATTT 


1260 




TTTATCATTT 


GTGGATCTAA 


AACTGTTCCT 


GGCATTCATC 


TCTCGAAAAA 


TAGCTAAAAC 


1320 


40 


TTGGTAAATC 


TTTAGAAGAC 


AATTCATCTA 


ATTGTGGATT 


TTCCGGATTT 


CGGATAACAG 


1360 




TTGGTnTATC 


CATAATGGAT 


CCTGGTTTAA 


TACCTTCCAn 


CnGGCGAACA 


TAGCC 


1435 



(2) INFORMATION FOR SEQ ID NO: 597: 

45 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 516 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

so 

ixi) SEQUENCE DESCRIPTION: SEQ ID NO: 597: 

55 
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AGAAAAAGAT TTAGAAAAGA TTACCATTCG CGACATAACA ACACGCGCTG ATATCAATAG 120 

AGGGACATTT TACTTACATT ACGAGGATAA ATATATGTTA CTCGCAGATA TGGAAGATGA 180 

GTATATTTCA GAACTAACGA CATATACTCA ATTTGATTTG TTACGCGGTT CTTCArTTGA 240 

AGACATTGCG AATACTTTTG TAAATAATAT ACTCAAAAAT ATTTTCCAAC ATATTCATGA 300 

TAATTTAGAG TTTTATCATA CTATTTTACA ATTGGAACGC ACGAGTCAAT TAGAATTGAA 360 

10 

AATCAACGAA CATATTAAAA ATAATATGCA ACGTTACATT AGTATCAATC ATTCTATCGG 420 

AGGCGTTCCA GAGaTGTATT TTTACAGTTA CGTTTCCGGA GCAACAATTT CaATTAnnTA 480 

15 AATACTGGGG TAATGGACAA ACAGCCCATT TTCAGT 516 

(2) INFORMATION FOR SEQ ID NOi 598: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1955 base pairs 
20 (b) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 



- (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 598: 



35 



40 



45 



AGTACTTTAC 


CATGAGGTAA 


GACTTTATTC 


CCTGCTTTTA 


TAGATTGTGC 


TTTTATTTGT 


60 


GTGCCAGAAC 


CAATAGtAct 


GGTcTAATGA 


TTTTGCACTC 


ACATTATCAA 


TAGCTTTTTG 


120 


TTTGTCTTGA 


CCTTCAACAT 


CTGGCACTTT 


ACTATACTCT 


GCATTAGATG 


TGTCATCTTT 


180 


TGATTTACCT 


ACATTTAAAT 


ATTTCAAAGT 


ATTTTCCATT 


ATTGGTTTAA 


ACGCTTTACT 


240 


AACACCTAAT 


TCATAAGCTT 


CTTGGTCATT 


TTTTTGTGCC 


AAGCTCATAC 


CAGCGTATAC 


300 


AATAACTTTA 


GGATTTTTCT 


TCGGCGCGTC 


ACCCATAAAA 


CTTACAAAAT 


ATGGGTTTGG 


360 


ACCTTTAACG 


TATCCACCAC 


CATTAGGTGC 


AGCGACTTGT 


GCTGTACCAG 


TCTTACCTTC 


420 


GACCTCATAA 


CCATCAATAC 


GATAGTTTGC 


AGCGTGACTC 


TTCTTACTAT 


TCACAACTAA 


480 


ATCCAATTGC 


TTTTCAACTT 


TTTCAGCAGT 


ATCTTTTGTT 


ATTGGTTTGC 


CTGCGATTTG 


540 


TTTTTGCCCT 


TTATAAAATT 


GTCTTTTACT 


AACAGGATTT 


TCAACGCTAT 


TCACAAACCA 


600 


TGGTTTTAAC 


ATATTACCAT 


CATTAAAGAA 


CGCTGATTGC 


GCTTGTAACA 


TTTGAACAGG 


660 


TGTTACTGTT 


GTCGATTGAC 


CAAATGATGA 


CGTTTTTTGt 


TGCAACTCAT 


TACTCCATCC 


720 


AATTTGaCCA 


GGTGCTTCTC 


CATCAAACAT 


ACCTTTAGTT 


GaTTTTCCaA 


ATCCaAATCG 


780 


TTCATACCAA 


GATTTCATTT 


TGTCTGCACC 


AACTAAATCT 


TGTAAATGCA 


TCATCAATGT 


■ 840 


ATTAGATGAA 


TAAGTAAATC 


CGAGTGACAT 


TGGGATTTCA 


CCCCAACCGA 


CTCTATTCCA 


900 



55 
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AAAAGCACCT TCTTGAATAG CAGCTGCTAA CCCATATGAT TTAAATGTTG ATCCAGGCTC 1020 

GTATGTGTTT TGATAAAGGT CATTTGCCCA CTTTTTACCA AAGTCTTTAC CAGTTTCAGG 1080 

5 

ATTAAATGTT GGTCGCTGAC TGTATGcTAA AATTTCTCCA GTTTTGGCAT CCATGACAAC 1140 

CGCAAATAAA TCTTTCGGCT GGTATCTTTC AACCATGCCA TCTAAAGCTT CTTCAACAAA 1200 

TACTTGAATA TTTGAATCGA TTGTTAAATG GACATCATCA CCACGTTTAG GCTGCTTCTC 1260 

10 

TTTTTTAGTA TTTGGTGCGA TATATCCCCA AATATCATGA ATATATCTCA ATGATCCTTT 1320 

AGATCCACTT AAATAACTAT CAAAAATCTT TTCAACTCCA AGTGCACCTT TAAGTTCACC 1380 

15 AGTATCCGGA TTTTTCTGAG CTCTACCAAT TAAGTGTGAT GCAAAATTGC CATTTGGATA 1440 

AAAGCGTTCT GTTTCAGGCA ATAAAGAAAT ACCAGGCAAA TTCATTTTCT CTATTTTCAA 1500 

TTTGTCCTGA TACGTTAAAT TTGTTCCTTT GCGTCCAAAT TCAATTTGGA AAGCTTTCTT 1560 

20 TTGACTAAGT CTCTTTTCAA TTTCCTCTGG CTTCATATTA ATGACTGTAG ATAATTTCTT 1620 

TGCAGTCTCT TTTTTATCAA CTACATGCCT AGGTTTTTTA GAATTGGCAC TOGCCTTTTT 1680 

ATCTATTACT GCAACAAGTT TATATCTTTC TACATCTTCT GCTAGCACTT TACCATkACG 1740 

25 

ATCATATATC TTTCCTCGTT CTGGTTGTTG TGCATTCTTA ACTAAATACT TTTCATTTGC 1800 

CTTCATGACT AAATCTTGAC CATTAGAATG TCCAGTAATC ATGATATATG AAATTCTTAA 1860 

AACCAATATA AAAAAGAGCA GTCCGAATAA ACCAACAAGT AGGACTGCCC CTATTTTATT 1920 

30 

TTTTTTAATT TTAATTTTTT TGGTCGCCAT TACTA 1955 
(2) INFORMATION FOR SEQ ID NO: 599: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 704 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

40 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 599: 
TAGCAAGAGT AGGTGATAAC AGTTCTTTTA ACGTGTTTGC TGCTTGCTCA TTTCTTGGCT 60 
45 CATTGTAGAC TAAAATATAA TAAGCGTTTT CAAATAAGTG CTTTTTAGCA TTTAGTACAC 120 
CAGATTTATG ACTACCAGCC ATTGGATGAC CACTGACTAA ATGAATATTA TGCTTTAATA 180 
AATTGCATTC GTGTTGCTGT ATCATTGCTT TAGTACTACC AGTATCAGAA ACAATAACAC 240 

SO 

CAGGTTTAGT TGGCATATCT ATAAGCTCGC TAAGATATTT ATTTGTGATA GCAACAGGTG 300 
TTGCATAAAT AATTACATCG GCTTTTTTAA TAGCTTCACT ATAATTTAAA CATTTTTCAT 360 

55 
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10 



15 



TATTAGTATT AGGGTTATGG TATTTTATAT TGCTAGCAAG ACTTCCACCA ATTAATCCAA 480 

GCCCAACAAA TAAAACTGTT GTCATATAAA TCACCTTATT TCGAAATTTT CAGAATAATA 540 

ACATTGTAAA TGAGCTGTTG ACACAGTGCA ATAGTAAATA AAAATCGATA ATAGCATTAA 600 

TAGATAAACG GAGATAAATC ATCTACAATA AAGAGTATAG TAACACAATG GCAACGGAGG 660 

GGTAAATCAA TGGAACCAAT ATTAGAAATG ATtAAAACAT TAAC 704 
(2) INFORMATION FOR SEQ ID NO: 600: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1158 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



20 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 600: 

CCTCTAAAGG ATCACGAACC TTTTTCATCG TGACTAAGCC TATAATACCC TTAAAcCTAT 60 

TATTATTAAC TTTTACCTCT GTGTATTCCC TATCAATTAG GCGACGCCAG TGACGTTTAT 120 

25 CTATATACTT TACTTTCACA GTCACCAACT CCTTGTCATT ATTATATAAA ACTACATAAA 180 

TGATGTCATG TCATGATACA GTTTTATAGT TTTTGTTAAT CATATGAAAA TATTTATTAT 24 0 

TATTTTACTA CAACTCGCTT CAATTTACTT AAAATAGACA ATATTAATTA GATAGTACAC 300 

30 

ACATTTCTTC ATAAAAGTGA TTTTTCAAAA ATATAAATAA CACACTCTTA TCGTTTTCAA 360 

AATCATTTAA TGCTATTTTC ATTAAAAACA GCTGAAGCAT CAAATCTATT CTGATTCAAT 420 

CAAGAATACA TATAAAAATG AAGTGACTCA AAGGTTTATT AACAACCTTC AAACCACTTC 480 

35 

ATTGATCACT TTTATTTTAA AGCATATTTT TCGATTACTG ATTTAAGATG CGGATATTGC 540 

GTAATTAATT CAGATTGCTT AAACAATTCA AACTGCTTAA ACTCAAATGC CGGTTGACAC 600 

4Q ATACAACCTA CTAAACTAAA AGTATTTGAT ATTTCGATTG AAGAAGCAAA AATTGTTCCT 660 

TTAGGCACTA CATATTGCAA TACATCTCCA TTTTGGATAT CAGTACCCAA TGTTGCAGTC 720 

GTATATTCCC CATCCGGATT TATCATATGA ATTGTTAGAG AATCGCCAGC ATGATAGTAC 780 

45 CATACTTCAT CAGCATCAAT TCGATGAAAA TGCGAAATAT TGTCATCTGT AAGTAAAAAA 840 

TAAATACTAC TAAACGGCGC TCTGCGTCCA TCTTTCAATA CTTCTCGAAT TGTCTCTCTA 900 

TAGAAACCAC CTTCAGGATG TGATTCAAGT TGCAATTcAT CaATCCATTG TTCTGCTGAT 960 

50 

TTCATTATTT CAAATCCACA TTATGGAATA CGTTTTGTAC ATCTTCTAAA TCTTCTAATG 1020 

CATCGATTAA TTTTTCAAAT GTTACTTGGT CCGCTTCAGA AAGTTCAATA TCTGTTTGAG 1080 

55 
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GAACGACTGC AAATTGAT 1156 
(2) INFORMATION FOR SEQ ID NO: 601: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 827 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 601: 



1K 
IO 


TGATACTTAT 


TTTTCAATAT 


TATTTGGAAT 


AAAnTCTTnT 


AATTGTGGTG 


TGAAATAAAC 


60 


ACCGAAATTC 


TTTTCAGATT 


CATCTTTTcC 


ACTACCTGCA 


TATAAAATAC 


CAATCAGTyC 


120 




ATGTTTAGAA 


TTCAATACAG 


GAGATCCTGA 


ATTACCTGGT 


TGTGCATACG 


CATCAAATTC 


180 


20 


. CATAAACGTT 


CCACTGATAT 


GGTTAATCGT 


TCCTGTCGAT 


TCAAACATTT 


TATATTTTGT 


240 




TTGTGCACCC 


TTTGGATAAC 


CAATAACAGA 


AATTCTATCT 


TTCACTTTTG 


CTCCGTCTGC 


300 




AAATTTTGTA 


TAACTAACGT 


TCTTATTAAA 


ATTCAAACCT 


TCTGTACTTG 


TTTCATGAAC 


360 


25 


ATGAACTATC 


GCAAGGTCTT 


CTTTTCCGGG 


ATATTCTACA 


ATGTCTTTAA 


CGTCGTAGTT 


420 




TCCTCCGCCT 


TTACCTTTAC 


TCGAATGATG 


TGCTGATACT 


CTATTTTTAA 


AAATATCATT 


480 




ACTTTTAGCG 


ATATGTTTGT 


TAGTTACGAT 


TGTATTTTTA 


CCAACAACTA 


CACCAGTACC 


540 


30 


ACCCACAAAT 


GCTACCACTG 


aATTGTATGG 


TTCCTTAGTT 


GCATCGGTAA 


TTTCTTTGAC 


600 




ATTCTTTTCT 


GCTTTGGCAA 


TTGAATGArG 


CTGATTAGAA 


ATATTTTCAG 


CAAAACCAAG 


660 




AGATGTTAAA 


ATAGTTAAAG 


CAGTTAAACC 


TTTAACCATT 


ACATTTTTAT 


TCATATTTTA 


720 


35 


CCTCCTTCCA 


AATTTATTTT 


nATAGTTAAT 


GTATCTAGAT 


ACACATTTAC 


TATATACATT 


780 




TTAAATAAAA 


ATATTnATTA 


AATATTAATT 


AACCACTTAT 


nAACGTT 




827 



(2) INFORMATION FOR SEQ ID NO: 602: 

40 

(i) SEQUENCE CHARACTERISTICS: 

<A) LENGTH: 796 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

45 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 602: 
50 nGGnACGTAA AGTATTTATG TTAAATGGCA nAAATATATG AATGATGAGT TACCTGGATT 60 

ACCAATGTTC CAAGGTAAAT CGATAACTAT TGTTAACGAT AAAGTACGAA ACTTAGACAT 120 
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CGACGATTTT GTCGAGGTTT ACTTATATGG GGGGATGTTA TGAATAATGT ATTGTTAGAG 240 

GTTAAAGATT TAGAAACATC ATTAAAAATA AATAATGAAT GGTTAGCAAC TGTTGAAAAT 300 

5 

ATTTCTTTTG AATTATCTAA AGGAGAAGTT TTGGGTATAG TAGGGGAATC TGGTTGCGGT 360 

AAGTCCATAT TAAGTAAGTC AATTATTAAA TTATTACCAG AAAAGATATC TAAACTAAGT 420 

10 AATGGAGAAG TTATATTTGA TGGTAAACGA ATCGATACGC TCAATGAGAA GCAATTGCTA 480 

GATATTCGAG GAAATGATAT TGCTATGATT TTTCAAGAAC CTATGACTGC TTTAAATCCT 540 

GTATTTACCA TAAAAAATCA ACTTGTGGAA TCTATAAAAT CACATAAAAA AATTTCTAAA 600 

15 AAAGAAGCAA ATAAATTAGC AAAAGATTTA CTAAAAAAAG TTGGAATTGC TAGACAAGAT 660 

GAAATATTAA ATAGCTATCC TCATCAATTA TCTGGTGGTA TGAGACAAAG AGTAATGATT 720 

GCAATGGCCA TTTCATGTTC TCcTAAATTA TTAATTGCTG aTGAACCTAC AACAGCATTG 780 

20 

GATGTCACGA TTCAAG 796 
(2) INFORMATION FOR SEQ ID NO: 603: 

2S (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 16X8 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 

30 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 603: 
GGATGTGTTC ATCCCAAATT GaAAcAgAaA TTTATGATCA AAtGATGTGG ATTGGTTTTA 60 

35 

AaCCATTCAa AATTaCCAAT ATTAmaCAAG AATCTGAAGA CATTAAATCA TTTtACAGTT 120 
GAAACTGAAG AATATGACTT TAGTGAATTT ACACCAGGCC AATACATCAC AGTTGATGTT 180 

40 TCTAGTGATA AACTTCCATA TAGAGCTAAA CGTCACTATT CTATCGTATC AGGTGAAAAA 240 
AACCATTTAA CTTTTGGCGT TAAACGTGAT GTCACAACAG AACATGAAGG CGAAGTTTCA 300 
ACAATTTTAC ACGATGAGAT TAAAGAAGGC GATATGATTA ATTTAsTGCG CCTGTAGGTG 360 

45 GATTCGTATT AGAGAATACG ACTGAACCAC AACTTTTCTT AGGTTCAGGT ATTGGTGTTA 420 
CACCTTTAGT AGCTATGTAT GAAGCTGCCT CTGCCAAAGG TTTAGATACA CAGATGGTTC 480 
AAGTTGCTGA AAATGAACAA CATTTACCTT TCAAAGACAA CTTCAACAGT ATCGCAAGCC 540 

SO 

ATCATGACAA CGCTAAATTA TATACACACT TAnAgATAAA CAAGGCTATA TTGGTGCTGA 600 
AGAATTACAA GTATTTTTAG CAAATAAACC TGAAATTTAT ATCTGTGGTG GTACAAAATT 660 
55 CTTACAaTCT ATGATCGAAG CACTTAAATC TTTAAATTAC GATATGGATC GCGTACACTA 720 



1534 



EP0 786 519 A2 

ATATGAAACT TAATCAACGT TACGTAAAAG TATTTGCATT ATATTTCGTA AGTATTGTTA 840 

CTGCAAATAT TATTGTTAAA AATAATAATT TAATTAAAAC AtTGATACAA ACCATAGCCG 900 

5 ' 

GGTACACGGT CTTTGCAGTT GGTTTGAAGT ATTTAACTAA ACGTAAAAAT AAATGACATC 960 

TATACCAAAA CAGCTATGAC TTTACTTTGT CATGGCTGTT TTTTAATTGG GAGTAGGACA 1020 

GAGATGATAT TTTCGCAAAA TTTATTTGGT CGTCCCACCA CAACATGCAT TGATGTATGC 1080 

10 

TCACTGAATT TCATAAGAAA GGAGTTCACA AGATGACCGT AGATATTGGA CGGATTTATG 1140 

ACAATAAAGA TAATACCGAC GCTATTCGTA TCCTAGTCGA TAGAGTCTGG CCGAGAGGTA 1200 

15 TTTCGAAAAG AACTGCTAAC CTAGATTATT GGTTAAAAGA CATTGCCCCT TCTACTGAGT 1260 

TGCGACAATG GTTCCAACAT GATCCTAAAC TTTTTGGAGC TTTTAAAGAA AAATATGAAA 1320 

AAGAATTACG TGATCAGGAT GCGCAAAAAG ATGCTTTTGA AAAATTAAAG GATATTGTAA 1380 

20 

ATCAGCATAA TCATGTTCTA TTGTTATATG CAGCAAAAGA TACTAAACAT AACCAAGCTG 1440 

TAGTACTACA GCAGTTGCTC AATACTTAGT TATATATGTT TATCGTGAAT CACTATAAAT 1500 

GTCGCTAACT TCATTTCTAA TATTTATTTT TAAAAAGCAT AATTACTACA ATTAATTGGA 1560 

25 

ACTTTAATAA TTACTAAACT TGGAACAATA TTTTACTTTA ACAAAATAAA GTTTTAAA 1618 

(2) INFORMATION FOR SEQ ID NO: 604: 

30 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2115 base pairs 
(3) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

35 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 604: 
ATTATAATGC AAATATTGAA GCATTTAAAA CAGTCGCTAA AGCAGTAGGC AAAGAGAAAG 60 

40 

AAGGCGAGAA GCGTCTGGAA AAGCATGATA AAATATTAGC GGAGATTAGA AAGAAAATTG 120 
AACAGAGTAC GTTAAAATCT GCATTTGCAT TCGGTATCTC AAGAGCAGGT ATGTTTATTA 180 
45 ATAATGAAGA TACATTTATG GGACAATTCT TAATTAAAAT GGGTATTCAA CCTGAaGtCA 240 
mAAAArAmAA AACTACGCAT GTTGGTGAAC GCAAGGGTGG TCCTTATATA TATTTAAATA 300 
ATGAAGAACT TGCCAATATC AATCCAAAAG TTATGATTTT AGCCACTGAC GGAAAAACGG 360 

50 

ACAAAAATAG AACGAAATTC ATTGATCCTG CAGTTTGGAA ATCATTAAAA GCTGTGAAAG 420 
ATAACAAAGT TTATGACGTT GACCGAAATA AGTGGTTGAA ATCAAGGGGG ATTATCGCAA 4 80 

GTGAAAGTAT GGCAGAAGAT TTAGAAAAAA TTGCAGAAAA AGCAAAATAA AAATACAGCG 540 
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TGTGATGATT TACCTGAAAG TTTATTTCGA ATAAATTTAA TTACATAACC GACAAGGATT 660 

GTTTTAACAG TTCTTTTAAT GAATTGGCGC ATCGTTACAT ACCTCATTTC TCTATATCTT 720 

ACGAACTATA TACCCATTCA TATATGCTTT TTAAACGTCA TTGTCACAAT TTAATTTTTA 780 

GGGAATATAA TATAACCATC TTTATCTGCT TTTTTAGTAA AAATGACAAA AATTGCATGT 840 

ATTATTGaGA TGATGGTAGG GATACCTGTC CAGAAAAATA ATAAGTGAAA AAGACCTTGT 900 

CCAAATTTAT CAGCATAAAA TTTATGaATA CCTAAACCTC CAAGAAATAA TGCAACmATa 960 

ACATAAATGG CTTTATTGAC TTTCATTTGT AAtCCTCCTT AACTATAATT CTACTTAAAT 1020 

15 TCGTTGTGAA AACCAATATT TCTAACTTTA GAATTTTCAA ACTTTCTAAA ATTATAAGTA 1080 

TATCTTTTTA AAATAAGCTA GAATTTCTAT ATAATAAATG TTAATAACGT AAAAGGGAAT 1140 

GATGACATAG TGATACGTCA AGCACGTCCA GAGGACCGAT TTGATATTGC GAAGTTAGTT 1200 

TATATGGTTT GGGATGATAT GGAATTAGAA TTGGTAAAGC ATCTACCTAA AGACATGGTA 1260 

TTAGATGCAA TTGAAAAAAG CTGTGTTGAT GCAACATATC GAACTTTTTA TCAGCATATT 1320 

TTAGTTTATG AAGTAGAAAA TAAAGTAGCA GGTTGTATTA TTAGCTATAG TGGTGAAAAT 1380 

GAATTGAAAT ACGAAAAAGC ATGGGAACTA CTTGACTTGC CAGAAAAAAT AAAACAATAT 144 0 

GGCACGCCAT TACCTGTAAA AGAAGCTAAA GACGATGAGT ATTATATAGA AACAATTGCG 1500 

ACATTTGCAG CATATAGAGG TAGAGGCATC GCGACAAAGT TATTAACGTC ATTACTTGAA 1560 

TCAAATACAC ATGTTAAATG GAGTTTGAAT TGCGATATTA ATAATGAAGG AGCATTAAAG 1620 

TTATATAAAA AAGTAGGCTT TATATCTGAT GGACAGATTG AATTATACAA GCACATGTAT 1680 

CATCATTTAA TTGTTAAATA AAATACTCGA CAGTTCGATG TAAGTCGATT GCCGAGTAGT 1740 

ATCATTTTCT ATTAAATGCC TGCAAATAAT GCACTAATAT AAATACCTAA TGCATATAAT 1800 

AAACCGAAAA ATGTATTTGT TTTACCAGCA GCAGCCATTG CTGGCATCAT TGTAGGCGGT 1860 

GTATCATTCT TCTTGAAACG TCTGATAACT TTAACAGGCA TTGGGAATGA TAACAACGCA 1920 

AGTAAGTAAA ATAATGAGCC ACCAGGTTTA ATAATGATCG TAAGTACAAT AAAGGCATAA 1980 

45 GCGATAAAGT ACATGATTGC CATAAATGTT AAAGAAGCAT TTTTACCTAA TAGAATGGGT 2040 

AAAGTTTTGC GACCACTTGC TTTATCTTTG ACACGGTCGC GAATATTGTT AGCCATATTA 2100 

ATTAAACCGA TAGTG 2115 
(2) INFORMATION FOR SEQ ID NO: 605: 



20 



25. 



35 



40 



50 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1003 base pairs 

(B) TYPE: nucleic acid 

55 (C) STRANDEDNESS : double 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 605: 



TATGTCTCAA 


ACTCAAATTA 


ATCAAATGTT 


CCAGCAGAAA 


AACATGTCTA 


CTGAATTAAA 


ACGTCGTTAT 


GCACAACGTT 


TATTACAGTT 


TCCACATGTA 


CACAATAAAG 


AATACTTGAA 


ATCTTATGCT 


AAAAACCCTA 


AAGAAACTAA 


AGATAGTTAT 


ATTTCTGGTT 


TTAAAGAGAA 


TCAATTGATT 


AAAATAGAAG 


CGATTAAATC 


ATTGTTTGCA 


ATGGATAAAT 


CTCCATTAGA 


ACATGTTAAA 


CCTGCTACAA 


AACCAGACGC 


TTCTTGGGAT 


GAGATGAAAC 


AAAAAGCAGT 


TGAAATTGGT 


AAAGCTGATA 


CTACATCGAA 


TAAATTTGGT 


ATTAGAGATC 


AATACTGGAA 


ATTAATTCAA 


GAAAGTAAGC 


GTAAAGTTAG 


ACGTGACTAC 


GAATTCAATG 


TTAATTCTCC 


AGAATTCCAA 


GATTTAGAAT 


TACTTGTAAA 


AACAATGCGT 


GCTGCTGGTG 


CAGATGTTCA 


ATATGTAAGT 


ATTCCATCAA 


ACGGTGTATG 


GTATGACCAC 


ATTGGTATCG 


ATAAAGAACG 


TCGTCAAGCA 


GTTTATAAAA 


AAATCCATTC 


TACTGTTGTA 


GATAATGGTG 


GTAAAATTTA 


CGATATGACT 


GATAAAGATT 


ATGAAAAATA 


TGTTATCAGT 


GATGCCGTAC 


ACATCGGTTG 


GAAaGGTtGG 


GTTTATATGG 


ATGAGCmAAT 


TGCGAAACAT 


ATGAAAGGTG 


AACCACAACC 


TGAAGTAGAT 


AAACCTAAAA 


nTTAAAATAC 


AAATAGCACA 


TAACTCAACG 


ATTTTGATTG 


AGCGTATGTG 


CTATTTTTAT 


ATTTTAAATT 


TCATAGAATA 


GAATAGTAAT 


ATGTGCTTGG 


ATATGTGGCA 


ATAATAAAAT 


AATTAATCAG 


ATAAaTAGTA 


TAAAATAACT 


TTCCCATCAG 


TCCAATTTGA 


CAGCGAAAAA 


AGACAGGTAA 


TAACTGATTA 


TAAATAATTC 


AGTATTCCTG 


TCTTTGTTGT 


TATTCATAAT 


ATGTTCTGTT 


AACTTAATAT 


CTT 





(2) INFORMATION FOR SEQ ID NO: 606: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1097 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 606: 
GCTnTTATAT TTAAAAAATT TATTnGCGGA TAATTACCTT TATTAAATCC CACCCATTAG 
GAwTaCGAGT AATAGGACTA ATACTGGAAT CACATAATGT AACATAACGT CCCTCCTTTA 
ACTTAATTTT AATTGTAATC AAATTTGACA ATAAGTCAAA mCATTAATAC CTATGATArG 
TATCATTTAT TAACATATGT ATCATATTTT TAATCTTGCG TAATTTTTAT CGTTAACTAT 
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CTTTTGTCAT TTTAATTATG TTAAGATAAT AGTAGTTATA GAAGTTCAAT CTATAGGAGG 360 

CATAGCATGG ATATTCCAAA AATCACGACA TTTTTAATGT TTAATAACCA AGCTGAAGAA 420 

5 

GCTGTTAAAC TATACACAAG CTTATTTGAA GATAGTGAGA TTATAACAAT GGCTAAGTAT 480 

GGTGAAAATG GACCTGGTGA TCCCGGGACT GTACAACACT CAATATTTAC ATTAAATGGA 540 

w CAAGTATTCA TGGCGATTGA TGCTAATAGT GGCACAGAAT TACCAATGAA TCCTGCGATT 600 

TCATTATTTG TTACAGTAAA AGATACTATT GAAATGGAAC GACTATTTAA TGGATTAAAA 660 

GATGAAGGTG CCATTTTAAT GCCAAAAACG AATATGCCAC CATACAGAGA GTTTGCTTGG 720 

15 GTTCAAGATA AGTTTGGAGT AAGTTTTCAA TTAGCATTAC CTGaGTAAAA GGATTCGCAC 780 

AGCtTGgAAT GATAAAGAAA CACTTTTTCT TATGCATGCG TTTTACCTAT GTATTTCTAT 840 

TTTAAGTACA CATTAGCATT TTAGTTTCGC TCATTTTTAA AATCACAAAG ATAATTTGTA 900 

20 

ACTTAAATGA TGATACGTTA TTTAAAAACA CGATACTTCG TTTCAATGAA CGCATTAAAT 960 

AAT AAATAAA CACCTCACCA TAAGAAAGGA CTACTTTCTT TTGTGAGGTG TTTatTTGTC 1020 

25 GACAACTTGA TTATGATTGT TTCATTTTTT GAATAAGTTC ATAATCAGGT GTAGCATACA 1080 

AAGTTTTTTG ATTGTCA 1097 
(2) INFORMATION FOR SEQ ID NO: 607: 

30 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2031 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

35 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 607: 
GAGGTCTAGC ATGTCTCGTT CAAAAAAATA CTTTTACTTA TCTAGCTTAA TGATTATTTT 60 

40 

AAGCTTTTTC TTTAATACAA ATAACGTTTT CCTAAGTGGA CTTTTTAATT CTTTTATTAA 120 
ATTAATACTT TTCTGCAGTG TTATTAACTC AATTGTACTA ATTTTGTCTA TAATTTTTGC 180 
45 AGATCGTTCA ATTAAATCAC TAAAGCCTGA TGCAGATTGG ATTAGAATTG CGAGTAAAAG 240 
TTTGCCTTGG aTTATTCTAA TTGTTATTTT AGTACATATC TTTTCAATTG TTCGTACATT 300 
CGGTTTTATT TAAAAAAGTT AATATGTCAT TGTAGCCTTA ATACAAAACA ATACAATGTA 360 

50 

TCATGCTATA ATGAGTAAAA CAATTTGATA ACGTTGTTGC GTATAAAAAA TATTAGATTT 420 
TCGAAATCAT AACTATGCAT CTAATCGCTA TAGTTATACA ACAAGATATA ACATATAATG 480 
AGGTTTGATA ATGCATCGAC AATTTTTGTC GTCGCGTTGC CAAAACCTCT TTTTTAAATT 540 
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TTTAGGCGCT TTATTACGTT ACCTCATTTC TTTTCTGAAT ACTGACGGAG GTTTTCCAAT 

CGGAACACTG ATAGCCAATT TGACTGGTGC CTTTGTAATG GGATTGCTAA CAGCCTTAAC 

AATTGCATTT TTTTCAAACC ATCCGACCCT AAAAAAAGCT ATTACGACTG GTTTTCTTGG 

TGCTTTAACG ACTTTTTCAA CATTTCAATT AGAATTAATA CATATGTTTG ATCATCAACA 

ATTTATAACT TTACTACTAT ATGCTGTAAC AAGTTATGTC TTTGGTATTT TGTTATGTTA 

CGTCGGTATA AAACTAGGTG GTGGTTTATC ATGATATCAA TCATTTTAGT CATGATTGGC 

GGCGGTTTTG GCGCAATTGC TAGAAGTGCC ATTACTGATT ATTTTAATCA TAAATTTACT 

TCAAAGTTAC CTATCGCAAC ATTGATAGTA AATCTAGTTG GTAGTTTTTT AATTGGATTA 

ACTATAGGCT TATCAATTTC AATCTCATGG TTCCCTGCGT TCTTTGTTAC CGGTTTTTTA 

GGTGGCTTAA CAACTTTCTC AACGTTAGCC AAAGAACTTA CACTAATGAT GACGCCAAAA 

TTTAATATTA ACCTTTTTCT CAATTATTCA CTTTTACAAT TCATCATTGG ATTTATAGCT 

TGTTATATTG GCTATCATAT TTAAAAATAA AATGCTTCAT TCAGCAAATA GGTAAATTAC 

GACACCTTCC TGAACGAAGC ATTTTTTAAT TTTCATGCAA ATTTTTAAGC ACCATATAAT 

GCCTACCAAA TTTCAATAAT CTTTGTTGCC GTTTAAATAA TGTGAATGTC AATAAATTCT 

CCAAACTAGT CGAAAATAAA GGGAGTGGGA CATAAATCCC TAAAAAAACA GCAGTAAGAT 

AATTTTCAAT TAGAAAATAT CTTACTGCTG TTCTCTATTT ATACAATACT TCGTATTGAa 

TGGcTTCGCT TTCCTAGGGT GCCGTCTCAG CCTCGGcTTC GACTGGCACT GCTCCCTCAG 

GAGTCTCGCC ATTAATAcTA CGTATTAACA TGTAATTTTA CTTTTACATA CTTTAAAAAA 

TAAGACACTT TGCCCAACTT ACACTACCAA TAGAAACCTC TGTTAGAATT CCTCAAAATG 

ATATTTCGCG ATATGTTAAT GAAATTGTTG AAACGATACC TGATAGCGAA TTCGATGAAT 

TCAGACATCA TCGTGGCGCA ACATCCTATC ATCCAAAAAT GATGTTAAAA ATCATCTTAT 

ATGCATATAC TCAATCTGTA TTTTCTGGTC GAAGAATAGA GAAATTACTT CATGACAGTA 

TTCGAATGAT GTGGTTAGCT CAAAATCAAA CACCTTCTTA TAAAACTATT AATCGTTTTA 

GAGTGAATCC TAATACTGAT GCGTTAATTG AATCTTTATT TATTCAGTTC C 

(2) INFORMATION FOR SEQ ID NO: 608: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 687 base pairs 
<B) TYPE: nucleic acid 
(C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 
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TCCCCGGGAA TCGAACCCGC GAnCTCCTGC GTGACATGCA GGCGTGTTAA CCGCTACACT 
ACGAGACCTA TTAnATTAAA AACTATGTAT TGCGGGAGGC GGATTTGAAC CACCGACCTT 
CGGGTTATGA GCCCGACGAG CTACCGAACT GCTCCATCCC GCGCTAATAT TATTTTGAAT 
TACCTAATTA ATATACCATA ATCAAAAACC TAAAGTsrrG AACTTTTTGA ATTTAATTTA 
AATGTTATCT CTTAAATAAT TACTTAAATA TCGTAGCAAC ATGTTCTCTG TTGAACACAA 
ATATTAGTAT ATTCATTTTT GTAGTGTACG TCAACGACAT TTTCAAAGTT TTTTGTGTAA 
AAAAACGCTT CTTATTCCCT TTTATCATAT AAGTGTCTAA TAGTTGTCAT AAATAGTGkT 
AAAGCATTTA AAAAGGTATA GGAGTTATAA AGTTTACAAC GCCTATACCT TCTGAAAAAG 
AAATTATAAA AGCTTGTTAC ACCGCATATT CTTTCAGTCA GCGACTACCA ATATAACATT 
GTAGCCCtAA GACATTGCTT GACGCCTCAn TTACAACAAT TTTTCAAAAT CAGCAGCTAC 
CTACTGACAC AACATAACAC AACCCnTACA CTAnCTATCG TGTCATGTAA TCTTGCATCC 
GATCTTGCAA CGCTGTAAAT GTTTCGA 
(2) INFORMATION FOR SEQ ID NO: 609: 

- (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 843 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 609: 
GTGTTGAATA CTTTGACAAA ATGAAATCAT TTGTTCTTTC GTTTCAAATT TAACTGTTTG 
AATTAAATCA GTTCGTTTTT CGTAGTACTT CGGCGTTGTG TTCATATTCA TTTTTTCTAA 
AAATAAACTA GTAAACAATG CACCTTTAAG ACTCTGACTG ACAACGTGTG GTGCTAAAAA 
GAAACCTTGA TACATTTCAA GCAATGCATT TAATGATGCA CCCGCTTCTT TACCAATACC 
AGGTGCTGTC AATCTATAAC CACATCGTTC AATTAAATCT TTTCTACCAG CAATGTATCC 
ACCAATCTTA GCTAAACCAC CGCCAGGGTT TTTAATTAAT GATCCTGCTA TTAAATCGGC 
ACCACATTCT ATAGGTTCAC GTCTTTCAAC AAATTCCCCA TAACAGTTAT CCACAAATAT 
TAAAATATTA GGATGCACGT TTTTCAACCT AGTAATTACC TTTTCAATTT CATCTAGCGG 
AATTGAAGGT CTTTGATCAT AGCCTTTCGA ACGTTGAATC GCTATTACTT TGGTGCGCTC 
AGAAACCCCa TCTAACACAC TTTCAATATC GATCTTACCT TCTTTAAGTG CAATATCTTT 
ATACGATmCG CCATGCTCCA TTAAACTTTC AATACCATTT CCGTTTACGC CAATGACTTC 
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ACTTTGTAAT GCAATAGTAA TCGCATGCGT ACCTGAAATA ATTTGCGGAC GAACAATTGC 
ATCTTCTGCT TTAAATGCCT GCGCATATAT TTCTTAATTG AACGAATTTA GAACTAATCG 
TAA 

{2} INFORMATION FOR SEQ ID NO: 610: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 775 base pairs 
<B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 
<D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 610: 
GATTATTATA AACCGAATGA AACAAAAAAG TTTTTACATA TTTTCAACAA CTTTATTTCA 
ATAAAGCATC AAGTTGATCT AAAGTTTGAT TCATACCTTG TTCAACACCC ATGTTTATGA 
CTTGTTGAGC GGCTTCTTTT GTTGGAAATA CCGATGTTGA TGTCACTGTC GTTTTCGTTG 
TATTGCTCTT GGAAAATGAC AAAGTAATTT TCATGCTTGG CATTTTTGTA TCTTTTGCAC 
CTTGAGGTGT CGCAAATGAG TCAATATATT CAATTAAATA TGGACGCTTA ACCGTTTTAT 
ATTCTGCTAA TGTATAGCTG GTCATTGTAG GTGTTTTAAT CGCATAAAAT GCATCACCGC 
CTGAAACAGC ATTAAAGCGA AACACTTTGG TACTAGCGTC TTTTGGAtGA AACCATTTTT 
CAAATAATGC TTTkGTCGTA TAGGCATCAA ACACCTTTTC AATCGGTGCT TCTATCGTTC 
TTGAAAAAAT AATTTTATTA TCTTCAACTT TAATCGTCAT CTTCCCACTC CCTATCTTTT 
ATATTTACTC ATCTTAACAT GCATTGAGTA ACATATGTTA CCAAATCATT TGTTATAAAC 
TATAGTAATA TTAATCATTC CCTCTGTnGA AATTGATAAC TACGAAATAA AAAACACACT 
CTATTCAGCT ATTAACAGTT GAGTAGAGTG TGCAAACCTG TTGAATTAAT GCGCTAACAT 
TTCTTCTTTG ATTTGGTCTT nATnTAATTT TGAAGGATAA TATGTTGGCC AGTTA 
(2) INFORMATION FOR SEQ ID NO: 611: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 728 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 611: 
ATCAAAATTT GATACTAAAG GGCTCACGCT ATTTTATGTA TTTATTGGAT TGATTATGTT 
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TGTGGCAATG TGTTTATTTA AAGTAGAAAA ACATGTTTCT TCACCATTTT TACCTGTGGT 180 

TGAATTTAAT CGTTCGATTA CTTTAGTTTT TATAACTGAC CTTCTAACAG CTATTTGTTT 240 

5 

AATGGGATTC AATTTATATA TTCCAGTCTA CCTTCAAGAA CAACTAGGAT TATCTCCATT 300 

GCAAAGTGGA TTGGTTATTT TTCCTTTATC TGTAGCTTGG ATTACATTGA ATTTTAATTT 360 

ACaTCGAATT GAAGCAAAAC TATCAAGGAA AGTTATTTAC TTACTATCAT TTACATTGCT 420 

10 

ACTAGTAAGT AGTATTATCA TTTCATTTGG TATTAAATTG CCGGTACTTA TAGCATTTGT 480 

GTTAATTTTG GCAGGATTAA GTTTTGGATA TATTTATACG AAAGATAGTG TGATTGTCCA 540 

15 AGAGGAAACT AGCCCATTAC AAATGAAGAA AATGATGTCA TTTTATGGAT TAACTAAAAA €00 

TCTTGGGGCA TCAATAGGTT CAACAATAAT GGGATATCTT TATGCGATAC AATCAGGAAT 660 

CTTTGGTCCA AACTTACACA nTGTGTTAAG TGCTGTTGCT GTAATTAGCA TGGGCTTATn 720 

20 

GTTTTATG 728 

(2) INFORMATION FOR SEQ ID NO: 612: 

(i) SEQUENCE CHARACTERISTICS: 
25 (A) LENGTH: 913 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

30 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 612: 



35 



40 



SO 



TATCAGAGCA 


AATAAGCAAG 


TTAGATAAAA 


AGATTTCTGA 


CTTACAATTA 


ATTAGACGCT 


60 


CTGTATGTGA 


ATTTATTAAA 


GGACTCTCTC 


TAATAGATAC 


CAGCATTTTA 


AACAAGACAC 


120 


TACAGTCACA 


ATATGATAAA 


GAAGCATCTA 


TAAAATATGG 


TCATACGAAA 


GCATATCAnT 


180 


CATTTATTAG 


ACGTAAAGAC 


AGCTTACAAT 


CGCAGGATAT 


CAGACATAAA TTGACAACTA 


240 


TCTTCAATAA 


ATTTAATCAT 


ATGTCTTTGA 


GTCATTATCC 


AATCCAAGAT 


TGTAGTGATC 


300 


TCGTATTTGA 


GTGGAAGGCA 


TTTATGAACA 


CTATCGCTGA 


TTTTGmTGAT 


GAAACATTAT 


360 


GCTGTATTGC 


TAAAACATAT 


GAAGATGATA 


CGCGTTTCAA 


AGATTACTTT. AATTCATATG 


420 


ATAATCAAAA 


TTTAGCATCA 


TACATTTCAG 


AAGCTGTTAA 


TTATTTTTTG 


AGCAATGTGA 


480 


ATAAGAGCGA 


CAATTTTTAA 


TCCTCATACA 


GATGCTACAA 


CACTGAATAC 


ACCAACTAAA 


540 


ATAATTGTTC 


AAAGTAGAAA 


ACTAATCATT 


TATTCTCTAA 


ATCAATAACT 


ATATTAAAAG 


600 


TTATACCTTT 


GCAAAGCGAA 


TTAGTATAGG 


TTACCGAAAG 


GAGAAAGGAT 


TAGGTTCCAT 


660 


TCGATTTATA 


AAAAAATATA 


TTTCGAAACA 


TACAAAAGCG 


CCAGAAGATA ATCATTTCCT 


720 
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TCAATGCATA TTCAACTAGC TCAGGTTTAC TCTTTAAGCC AAGCTTTGTC ATAATATGCG 



840 



TCTTATGTGC TTCTACTGTT TTCACAGATA CAAATAATTT CTCTGCAATT tCTTTATTCC 



900 



CGTAACCTTT GGC 



913 



10 



15 



20 



25 



30 



35 



40 



45 



50 



(2) INFORMATION FOR SEQ ID NO: 613: 

<i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 654 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 613 : 

ACAAGTGTTG ATGTCATAGT AGCGTCAAwT GTGCTTTATT TCTGGGACAC ATTTAAATTT 60 

TTCCACCCCA TTACTTGGAG CTTAATCTTT ATTACAATTT TACTATTATT AAACATTTTT 12 0 

TCTGTAAAAT CATTTGGAGA AACTGAGTTT TGGTTATCAT TGATTAAAGT GTTAACAATT 180 

ATCGTATTCG TTATTTTTGG CTTTTTAATG ATTTTCGGTA TCTTAGGTGG TCATACATAT 240 

GGATTTGAAA ACTATACAAA AGGCCAAGCA CCGTTTGTTG GTGGTATCTC TGGTTTCTTA 300 

GGCGTATTAT TAGTCGCCGG ATTTTCGGTT GGTGGTACAG AAGTAGTAGC AGTAACTGCT 360 

GGTGAATCAG ATGACCCTAA AAAGTCTATG CCTAAGGCAA TTAAACAAGT ATTTTGGCGT 420 

ATTCTTTTAT TCTATGTCTT ATCAATTGCA GTAATTGGTG CAATTATTCC GTACACAGAT 480 

CCATCATTAT TAAGAGCAAG TAGTTCAATA AGTCAAAGCC CATTTACAAT TGTATTCGAT 540 

AGAGtAGgCA TAGCCTTTGC AGCATCAGTA ATCAACGCGG TTATTTTAAC TTCATTATTA 600 

TCCGCTGCAA ATTCAGGTGT TTATACAACA GGCAGAATGT TGTATTCCTT AAGT 654 
(2) INFORMATION FOR SEQ ID NO: 614: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 642 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS: double 
(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 614: 

TCGATCTTTA TTGATAATAA TTAAATTGTC GCCTTTAAAA TGTGATATTA ATCCTGCGGC 60 

AGGnTGTACA ACGAGTGATG AACCTAGTAC AACAAGGGTG TCAGCATGTT CAATTTTATT 120 

TAATGCCCTT ATGATGGTAG GTTGATCTAA CATTTCACCG TATAATACGA TGTCCGGTCG 180 
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ATAAGATTTA TGACATACAT TACAATAAAA ACGATTTAAC GTGCCATGTA ATTCATCAAC 300 

ATGTTGACTT CCAGCGTCTG AGTGCAAACC ATCGATATTT TGCGTGATGA CACCTAAAGA 360 

5 

TTGTTGATTA CGTTCTAATT TTGCAATCCA ATCATGAACG ATATTGGGCA TCGTATCGAC 420 

AAATAGTAAG CGCTTATGGC AGAAATTGAT AAAACCTTCA GGATCATCTT CTAAATAATC 480 

w ACGGCTTAAC AAGTATTCTG GCGAAAGCCC ATCTTTTGaA ATTTCATCAA ATAAGCCACC 540 

CATTGaACGG AAATCTGGAA CGCCACTTGC GACAGATACA CCAGCACCTG TAAAAAATGT 600 

AATACGATTC GAACTATCTA TAATATGTTT TAGTGTCTCT AA 642 

'5 (2) INFORMATION FOR SEQ ID NO: 615: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1210 base pairs 

(B) TYPE: nucleic acid 
20 (C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 615: 

25 

TTTCCCCnCC CCnCCAAATA TCCAAnGGAA CTTTAATAGT CCAATTGGCA CAGTAAAACT 60 

ATGGCATTTT ATAAGTATAA TATATCTGTA ATTTATGGTC AATTAGTAAA TTGTTTTTTA 120 

30 TTTGAAACAT ATTTCACATc AAAATCACAA AGACTTTTAG ATTTTGtTCT AAAAATCTCT 180 

TAATAATTTA TTTAATGAGA AGAGTTGCTT ATATAGTAAA TTGTGAAGCC GTTAAAACAA 240 

CGTTACAAAA CCTATATCTT TAATACGGAA CCATATGGTA TGAATCAAGG AATACTTAAA 300 

55 CTAAAACTTC TCTATCAGAT TTATTTGTTG CGAAATCAAC AACTTTAATT GCTTGCCCTT 360 

CATTTAATGG ATAATTTGCT TGCGTAATTT TAACTTTTAC AATTTGACCT ATGAGTGATT 4 20 

CGTCACCTTC AAATTGTACT TTCATATAAT TATCTGCATA TCCAACTAAT GTACCTTCTG 480 

40 

TGtCACCCTG TTCCTCAGGA ATTACTTCAA GCACATCTTG ATCAAATTTA GACGCATATA 540 

ACTTTCCGAG TTGATTGCTT AGCGTAATTA ACTTATGCAC CCGTTCATTT TTAATTTCTT 600 

45 CATCAATTTG GTCATCCATT CTTGCAGCTG GCGTGCCAAT TCTAGGAGAA TAAGGGAAAA 660 

CATGCAGTTC AGAGAACTTA TGCTTTACGA TAAAATCATA TGTTTCTTGG AACTCAGCTT 720 

CAGTTTCACC TGGGAAACCA ACAATTACAT CACTCGTAAy TGCCAAGTCT GGTAAAGCTT 780 

50 TATGCAATTT TGTTAATCGT TCTGAAAATC TATCCATTGT ATACTTACGT CTCATACGTT 840 

TTAATACTGT ATCTGAACCA GATTGTAATG GAATATGCAA ATGACGCACA ACTTTTGTTG 900 

AACGTTCTAA AACGTCAATT ACTTCATCTG TAAGTTGACT TGCTTCAATT GAAGAAATTC 960 

55 



1544 



EP0786 519 A2 



CTTTTAAATC TTGACCATAT CCACCTGTAT GAATTCCCGT CAATACAATT TCCTTATATC 



1080 



CTGAATTCAC TAGTTGCGTC GCTTGTTCAA CTACTTTTTC CGGATCTCTT GAACGCATTA 



1140 



AGCCACGAGC CCATGGAATA ATAcAGAATG TGCAGAAGTT GTTACAACCT TCTTGAATTT 



1200 



TTAATGACGC 



1210 



10 



15 



20 



25 



30 



35 



40 



45 



50 



(2) INFORMATION FOR SEQ ID NO: 616: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 652 base pairs 

(B) TYPE: nucleic acid' 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 616: 



TAATAAAATA 


CAATACTTTT 


CAATACAGAG 


AATCCCGCAA 


TGTCGGGATT 


CTTATTTATG 


60 


CTGATTTTGT 


TTTTGTCTAT 


GATCAGGGAC 


TTtCAGGGAC 


TCAATTAATT 


ATCACATTCA 


120 


TATTTTCTTA 


TGACCAAATT 


GATACATATG 


ATGCTATTTA ATGAGAAXAT 


TAGGCATCAC 


180 


TTGGTTATTG 


AATTTCCTTC 


ATTAAACTTT 


CCAGCTCAAT 


TTAATAGTTA 


GTCGACTATT 


240 


ATTCATTAAA 


CACriTTTAA 


TCATAAAAAA 


GTGTTTTTGa 


TAATTCACTa 


CCaAAAACAC 


300 


CTTCTTACTT 


ATAATTCTAT 


TTGTTCACCA 


TTTCTAATCT 


TATCGGCTAA 


ATCATTCAGT 


360 


TTTCTTAATC 


GGTGATTTAC 


ACCTGATTTT 


GAAATTGGAC 


CAGTTGATAC 


CATTTCTCCA 


420 


AGCTCTTTCA 


ACGAAATTTC 


TTGATGTTCT 


ACTCGAATTC 


TAGCAATCTC 


TCTCAACCTG 


4 80 


TCTGGTAAAT 


TTTCAATACC 


AATTTCTTTA 


TCAATCAATT 


TAATGCTCTC 


AACTTGTTTC 


540 


ATCGCAGCAC 


TAACTGTTTT 


ATTTAGATTG 


GcCGTTTCAC 


AATTAACGAG 


TCGGTTAACA 


600 


GAATTACGCA 


TATCTCTTAC 


AATACGTACG 


TCTTCAAATT 


TTAATAACGC 


TT 


652 



(2) INFORMATION FOR SEQ ID NO: 617: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 798 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 617: 
TnACCACTTT AAAATAGCGC TTAATAAAtG AAGGGGGCAA GTCTTATGAC GtTTTACaAT 60 
TTCATCaTGG GTTTTCAAAA TGrTAACACA CCATTTGGTA TATTGGCCGa ACACGTTAGT 120 
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TCTAATTACA CAGATCATCA ATTAATTGAA ACTACAAATA GAGCTATTAG CTTATATATG 240 

GCAAATTAAT TTGAGTAGTA CCAATTATGA TGTATTAGTG CATCCCAAAT ATCTTTTGTT 300 

5 

TTAAAGTTTA TTTCATCATT TCTTATCGAA AATGGTGTAA TAATGTCTTT ATCTAACCAA 360 

GTGTTGATAA GTTCATTTGG TACACCATCT AACAACATTT CACTTTTACT AATTATAAAA 420 

CATTCCCAGT CAAGTGAAAC ATTTTGTGGA TTCACATAAT TACATTGATT ATGATTATCC 480 

10 

ATAAACACTC ACTCCTTTAA AATTCTGTAC TCTTCATTGC GTTTTACCCC GTCACATTAT 540 

CTTTTAAACT AAAATCATCA TTACTTATGA AAAAAATGTA CATCAAAAGC AAAGGTTTTC 600 

15 GCTACCGAAA AAGTTTAAAT AATGGTttAA TATATttGGT ACTCATTTTA ATAAAAAGAG 660 

AATACATTTT GAGCTATCAA TACTTTTTAT TGAAGAGGTG TTATTsyTGG CTAAAACGTT 720 

ATATTTAATG CGCCACGGAC AAACTTTGTT TAATTTTAAG GGACTAATTc AGGGATTTGG 780 

20 

AGATTCGCCG CTAACAGA 798 

(2) INFORMATION FOR SEQ ID NO: 618: 

(i) SEQUENCE CHARACTERISTICS: 
2S (A) LENGTH: 1786 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
<D> TOPOLOGY: linear 

30 

<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 618: 
ATACGCTCAA TTGATAAAAA TTTAATATCT GCCATTTGTA TACGCATCGC TTCGAATGTT 60 
35 TCCGTTGCAA TATCAAATGA TAATTGTGAC TGGAACCTTA AACATCGAAT CATACGTAAA 120 
GCATCTTCTT GGAATCGTTC CTCAGCTATA CCTACAGTTC TTATTATTCG ATTATTAATA 180 
TCTTGTTGAC CATCAAAATA ATCATACAAT TTGTATGCTG TATCCATTGC TATCGCATTC 240 

40 

ATCGTGAAAT CTCGTCGTTG CAAATCTTCG TATAAATCAC GAACAAATGT AACACCACTT 300 
GGTCTACGGT GATCGACATA ATCTTCTTCA GCCCGGAATG TTGTCACTTC ATAATTTtCA 360 

45 TCATtAAAaa CTACATTtAT CGTGCCAtGT yCTTnACCTA CAGGTATCGT ATGACTAAAG 420 
ATAGATTCTA TTTCATCCGG CGTTGCACTT GTTGTGATAT CTATATCATG AATATTTCTT 480 
CCCATGACAT AATCTCTTAC AGAGCCACCT ACATAATATG CTTCAAAACC ATTGTCTTGA 540 

50 ATTTGTTCTA ATATAGGCCT TGCCTGTTCA AATAATGATT TATCCATATT ATTACTCGCC 600 
TTTACTTTTG TTATGCTCAT TTAGCATTTT TTGATAATAA TACTCATATT GATCTGTAAT 660 
AAGTTCTGAT CCAAAACGTT CAGCAATATC TGCTAGCATG TTTTTCTGAA GTTTGTTGTA 720 

55 
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ATCTACGACA AATCCAGTTT CACCATGTTT AATAACCTCT TTAATTCCAC CGGCATTTGA 840 
ACCAATTGGA ACGACGCCTG TwTTCATAGC CTCAAGTAAA GTTAGTCCAA AGCTTTCTTT 900 

5 

TTCACTTAAT AATAATACTA AGTCAGATAA TTGGTAAAAT TCACTTACGC AATCTTGTTT 960 
CCCTAAAAAT AAAACATCCT CTTCTACGTT TAACTCTTTC GTCAATTGAC GCATTGGCAC 1020 

w TAATTCAGGA CCATCTCCAA GTAAAATTAA TTTACTAGGT ATCTTTTCAC GTACTTTTGC 1080 
AAATGTTTCT ATAATAGTAT CTATGCGTTT TACTTGTCTA AAATTCGATA CATGTATTAA 1140 
CACTTTTTCA TCTGGTGCTA TACCAAATTG TGATTTTAAT GCTGTGTTAT GTTTAGTTGG 1200 

15 AAACTCATTT TCACGTACAA AATTATAAAT CGGTATAATT TCTTTGTTAG TTTCAATAAT 1260 
TTCATGTGTT TCTTGTGCTA AAGATTTACT CACACTTGTC ACAATATCAC TTTTTTCAAT 1320 
GCCAAATTTA ATTGCACCTT GGAGTGAATG ATCATAGCCC AAAACAGTAA TATCAGTACC 1380 

20 

GTGTAGCGTT GTCATAATTT TTATATCTTT ACCTGACATC TCACGAGCTA AAATCCCACA 1440 
AATTGCATGA GGTACAGCAT AGTGCATATG CAACAAATCA AGATCATATT CTTTAATAAC 1500 
TTCAGCGATT TTAGTACTTA ACGTAATATC ATACGGTGGA TACTGAAATA CTGCATATTG 1560 

25 

ATTCACTTCA ACTTGATGAA AAATCATATT CGGTAATGGT TTTCTTATTC TAAACGGGAT 1620 
ATTTGAAGTG ATAAAATGTA CTTCGTGACC TCGCTCTGCT AATTTAATTC CTAATTCTGT 1680 
30 GGCAATAATT CCAGAACCAC CCATGGACGG GTAACATGTT ATACCTATCn TCATTCGCTT 1740 
GCCCATCCTT TCTTTCTATT TCTCnCTATG ATnCTCGATG CGTAGA 1786 
(2) INFORMATION FOR SEQ ID NO: 619: 

35 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 844 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

40 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 619: 
45 ACAGGTATGG ACTTnGCTCA AATGACACGA CATTATTTAT CAAGACCTAT TGCTATAATC 60 
TTTTGGATCA TTGCAGAACT AGCAATTATC GCTACAGATA TTGCTGAGGT TATTGGTAGT 120 

GCTATTGCTC TTAATCTCCT ATTTAACATA CCTTTAATCG TCGGTGCACT AATAACTGTA 180 

SO ^ 

CTTGATGTAT TTTTACTACT TTTTATAATG AAATATGGTT TTAGAAAAAT TGAAGCTATT 240 

GTTGGTACAT TAATTTTCAC AGTGTTATTC ATCTTTATAT TTGAAGTCTA TATTTCATCA 300 

CCACAGTTGA ATGCTGTGTT AAATGGATTT ATACCACATA GTGAAATCAT TACAAATAAC 360 
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TTACATTCAT CAATTGTACA ATCTAGAACA TACTCAAGAC ATAACAATGA AGAAAAAGCG 
CAAGGaTTAA ATTTGCTACG ATAGATTCGA ACATTCAGTT ATCAATCGCA TTTGTAGTCA 
ATTGCTTATT ATTAGTGtTA GGAGCATCAC TATTTTkCAA CTCAAATGCT GACGATTTAG 
GTGGTTTCTA TGATTTATAT CACGCCTTAA AAACTGAACC TGTACTAGGT GCAACAATGG 
GTGCAATCAT GAGTACATTA TTTGCAGTTG CATTATTAGC GTCAGGTCAA AATTCAACGA 
TTACTGGTAC TTTAGCAGGA CAAATTGTAA TGGAAGGATT TTTAAGATTA CACATACCAA 
ATTGGTTAAG ACGTTTAATT ACACGTTCTC TTGCTGTCAT TCCTGTTATC GTATGCTTAA 
TCAT 

(2) INFORMATION FOR SEQ ID NO: 620: 

U) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 574 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

. (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 620: 

TGTATTGCAG TCATGCCATA AATTTTTTGA ATAATAAACG GAGACGCAGA AATATAAGTA 

AATAATATTA CAAATGTCAT ACCTTGGAAT GAGCATTGGT AATACAAAAC GTGGCGTCTT 

CAnTAATATT TTGAAGTTTT TAAACATTGT CTTTAaTCCA CTACTTGACT CACGATTTGT 

CACTGTTAAT GATTCAGGTA CTTTTAATAA AGAACCTATG ACCATGACGA AGCCAAAGAT 

AGTCAGAATG ACAAAGACCA TACGCCAGAC AGAATAATTT AAAATTATGC CCCCTATTGT 

TGGCGCAACA ACTGGTGCAA TACCATTAAC AAGCATCAAT AATGCCATAA ACTTAGTTAG 

TTCATTACCA CTATACATAT CACTTGCTAT AGCTCTTGAA ATAACTGCTG tGCGCCACCT 

GTCACTCCTT GAAGaAATCT TAATGCAACC ATCAGCCAAA TATTATGTAC AAAAACAATA 

CCTAAACTTG CTAATGTAAA AATAATCATA GCTATAATAA GCGGCTTTCT GCGCCCAGTT 

GAATCTGAAA TTGGACnAGC AACCAAATTA CCAA 

(2) INFORMATION FOR SEQ ID NO: 621: 

(i). SEQUENCE CHARACTERISTICS: 

<A) LENGTH: 523 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 
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AAGCAAGAGA GAGTACAACA TTTATATGAT ATTAAAGACT TACATCGATA CTACTCATCA 
GAAAGTTTTG AATTCAGTAA TATTAGTGGT AAGGTTGAAA ATTATAACGG TTCTAACGTT 
GTACGCTTTA ACCAAGAAAA TCAAAATCAC CAATTATTCT TATTAGGTAA AGATAAAGAG 
AAATATAAAG AAGGCATTGA AGGCAAAGAT GTCTTTGTGG TAAAAGAATT AATTGATCCA 
AACGGTAGAT TATCTACTGT TGGTGGTGTG ACTAAGAAAA ATAACAAATC TTCTGAAACT 
AATACACATT TATTTGTTAA TAAAGTGTAT GGCGGAAATT TAG ATG CATC AATTGACTCA 
TTTTCAATTA ATAAAGAAGA AGTTTCACTG AAAGAACTTG aTTTCAAAAT TAGACAACAT 
TTAGTTAAAA ATTATGGTTT ATATAAAGGT ACGACTAAAT ACGGTAAGaT CACTATCAAT 
TTGAAAGATG GAGAAAAGCA AGAAATTGAT TTAGGTGATA AAT 
(2) INFORMATION FOR SEQ ID NO: 622 : 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1871 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 622: 
AGAAGTGTGA nAAAAATTTA AnAGAGATAT GCACATAGAT GACGCATTGC TATATCCAAG 
CAATTGAGAA AGCTGCTGAT GCTCCAAATC aCGGAATGAG GGAACCATGG AGAGTTGTGC 
ATGTTCCGAA AGACAGATTA GGAGATATGA GTAAGGATAT TTCTAAATTT GCATTTCCTA 
ATGAATTAGA TAAGCAACAA TGTCATTATG ATGCAGTTAC GAAACTAGGT GGCATGTTAT 
TGCTTATTTT AAAAACAGAT CCAAGACAAC GTCAAAATGA TGAAAACTAC TTTGCATTTG 
tGCATATGCA CAAAATCTTA TGTTGTTACT TTATGAAGCG GGAATAGGTA CATGTTGGAA 
aTCGCCATTA TATATCTATG ATCCTAAAGT AAGnAAACAC TTGGTATAAA GnAAGATGAA 
GTTCTTGCTG GATTCTTATA TTTAACGGAT TTAGAAGnAG ATATGCCTAA AGCACCACGT 
AAAAATAGAA ACTTAATTAC ATTATATTAA TATGTATAAT TATAGAAACA TTAATAAAAG 
CTGAGTCATG AATTGATGGA CATCTATCGA GTTAGAGATT TAATCTAACT TACTAGAGTC 
GGTACAATAA CAGTCTCAGC TTTTTATTGT GCAGTATATA CACATTTTTA TTTTAGTATT 
TATTtAAAAG TTtCTGCTaA AAATGATTCA ACTTGTTCAG GTGACTTAGC ATTTGCTGAA 
TGAAGGTGTG CAATTTTATC GCCGTTTTTA AAT ACT AG CA AGCTAGGGAT ACCCATAACT 
TCATTTTCAA CAACTACATC TTCTAATTCA TCACGATTAA CAGTATACCA TTGGTAATCA 
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CCTGCCTCAA ATTTAACAAT TACAGGTGTA TCGCTATTAA TTACAGATTT AAATGATTCA 
TTACTTTTGA TTGATTGCAT TGTAACAACT CCTCTAGATA GTTTAATAAT TTTTATTATA 
GCTAAATTTA TATCATAATA AAAAATTTTA GCTTCAAAAT GAAAGCCTTT TGCTTTGGAA 
AATGATATAT TTATTTTAAA TACATAAAGG AGGTTGCAGT CGTATGATTA AATTTTACCA 
ATATAAGAAT TGTACAACTT GTAAAAAGGC AGCAAAGTTT TTAGATGAAT aTGGCGTAAG 
TTATGAACCA ATTGATATCG TTCAACATAC ACCTACAATA AATGAATTTA AAACAATAAT 
TGCAAATACA GGCGTAGAAA TTAATAAATT GTTTAATACA CACGGCGCGA AATATCGTGA 
GCTTGATTTG AAAAATAAAT TACAAACTTT ATCAGATGAT GAAAAGTTAG AGTTGTTATC 
ATCTGATGGT ATGTTAGTAA AGCGTCCTCT AGCAGTAATG GGCGATAAGA TAACATTAGG 
ATTTAAAGAA GATCAATATA AAGAGACTTG GTTAGCGTAA GTGaAATGTA AGCGTTTACT 
AAATATCTCG ATATTTAGAT TCATTACATG TAAAATGAAA TAAGCTATAC AATTGTTAAT 
TTTTATAAAT ATAGTTGAAT AGCATCTAGC CTTATGGCAT CATTAATGAT GTAAAGATTA 
ATTAGGAGGG GATTCTCTTG GCAGTACCAA ATGAAyTGAA ATATTCAAAA GAGCATGAAT 
GGGTTAAAGT TGAAGGTAAT GTAGCAATAA TTGGAATCAC AGAATACGCA CAAAGCGAGT 
TAGGTGATAT TGTTTTCGTT GAATTACCAG AAACAGATGA TGAAATTAAT GAAGGGGATA 
CGTTTGGTAG CGTAGAATCA GTTAAAACTG TATCAGAATT ATATGCACCA ATCTCTGGTA 
AAGTAGTTnA A 

(2) INFORMATION FOR SEQ ID NO: €23: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 451 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 623: 
TTGCTGTAGA AGATAAAGAG TCCCATCAAT GGATAGGCTT TATAGGTTTG AATTATATTC 
CAGAAACAAG CGATTATCCA TTTAAAGAAT TACCGCTTTA TGAAATAGGT TGGCGCTTGT 
TGCCAGAATT TTGGGGAAAA GGATTAGCAA CTGAAGGCGC AAAGGCAACA TTGAAGTTAG 
CAGAAGAACA TCAAATATAC GATGTCTATA GTTTTACAGC AGAAGCAAAT AAAGCTTCAC 
AACGTGTAAT GGAAAAAATT GGCATGACAG TGTATGATCA TTTCGAATTA CCCAATCTAA 
GTAAGTATCA TTTATTaAAA AGGcAAGTGC GCTATTACAT TAATCTTCcG AAAGTGGAAA 
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ATTAgGGGGT GtTTnGTkTn ATTTTTTTAA n 451 
(2) INFORMATION FOR SEQ ID NO: 624: 

5 <i> SEQUENCE CHARACTERISTICS: 

(A) LENGTH :* €65 base pairs 

(B) TYPE : nucleic acid 

(C) STRANDEDNESS : double 
{D) TOPOLOGY; linear 

10 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 624: 



15 



20 



CGATAGTTAT 


CTAAAGCCAT 


TTTnGATTGT 


GTTATGAAAT 


CTAATGATGC 


GTGATAATTT 


60 


AATGCrACAT 


AACGrTaATA 


TAAAATATCA 


ATAGTGAACA 


TTTGAGCAAA 


TAATGAAGTT 


120 


GTTGCTCCCA 


TATGCATCTC 


ATTTTCATCA 


GTTTTCCCAT 


AAGTTAAAAC 


AATATTTGAT 


180 


GCCTGTGCTA 


CGGGATTATC 


CCTTGTACTA 


GTAATTGTAA 


TTATAGGTAT 


ATGGTAGTCA 


240 


■TCAATAACTT 


TAACCATTGA 


TTGCATTTCA 


CTTTGCGTAC 


CATTGTTAGT 


AATAAGAATA 


300 


aCACTGTCGT 


TCGAATTGTG 


AGTTGCTAAT 


AATGTAGCAA 


AAATATGTGT 


TTCTTGAACA 


360 


AGTTGAATAT 


TAAGACCTAT 


TCTTGATAAC 


TTTTGGTATA 


AGTCGGTAGC 


AACTACAAAA 


420 


GATGCGCCAA AACCATATAT 


AAAAATCGTC 


TCAGAACGTT 


TTAAACAATG 


ACATATTTGA 


460 


TCAATAGTTT 


TATCATTTAA 


TTCGTTATTT 


GCATGATTAA 


GTGCGCGTGT 


AGTACGTGTA 


540 


TGGAGTTTAG 


TTCTTAAAGA 


TTCTGTGCTT 


TCGTTATTCA 


TTAATTCAAC 


ATTGTAAATT 


600 


GATGATGCTT 


TAGGAACATA 


TTTAGATATA 


TTTATTTTCA 


AGTCGTGAAA 


ACCGCCATCA 


660 



35 GTAAT 665 

(2) INFORMATION FOR SEQ ID NO: 625: 

(i) SEQUENCE CHARACTERISTICS: 
4Q (A) LENGTH: 2549 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

45 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 625: 
GATGCCAATT AACCGTGCAT ATAATGTTGA GAAGTTAATC GAAGCAATTC AATATTATCA 60 
50 AGAAAAAACA AATCGTCGTG TTACTTTTGA ATATGGTCTG TTTGGTGGTG TGAATGACCA 120 
ACTAGAACAT GCAAGAGAAT TAGCACATTT AwTAAAAGGC TTAAACTGCC ATGTTAACTT 180 
AATTCCtGTC AACCATGTTC CAGAAAGAAA TTATGTGAAA ACGGCTAAAA ATGATATCTT 240 

55 
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TTCGGATATT GACGCAGCTT GTGGTCAATT AAGAGCAAAG GAACGACAAG TAGAAACGAG 360 

GTAAAGACAA ATGCTAGAGG CACAATTTTT TACTGATACT GGACAACATA GAGATAAGAA 420 

TGAAGATGCG GGTGGTATTT TTTATAATCA AACTAATCAA CAACTTTTAG TTCTGTGTGA 4 80 

TGGTATGGGT GGCCATAAAG CAGGAGAAGT TGCAAGTAAA TTTGTTACAG ATGAGTTGAA 540 

ATCyCGTTTT GAAGCGGAAA ATCTTATAGA ACAACATCAA GCTGAAAATT GGTTGCGTAA 600 

TAATATAAAA GATATAAATT TTCAGTTATA TCACTATGCA CAAGAAAATG CAGAATATAA 660 

AGGTATGGGT ACAACATGTG TTTGTGCACT TGTTTTTGAA AAATCAGTTG TGATAGCAAA 720 

TGTCGGTGAT TCTAGAGCCT ATGTTATTAA TAGTCGACAA ATTGAACAAA TTACTAGTGA 780 

TCACTCATTT GTTAATCATC TTGTTTTAAC GGGTCAAATT ACGCCGGAAG AAGCATTTAC 840 

ACATCCACAA CGTAATATTA TTACGAAGGT GATGGGCACA GATAAACGTG TGAGTCCAGA 900 

20 TTTGTTTATT AAGCGATTAA ATTTTTATGA TTATTTATTA TTAAATTCAG ATGGATTAAC 960 
TGATTATGTT AAAGACAATG AAATTAAGCG TTTGTTAGTA AAAGAAGGTA CAAT AG AAG A . 1020 

TCATGGTGAT CAATTAATGC AATTGGCATT AGATAACCAT TCGAAAGATA ACGTTACTTT 1080 

CATACTCGCG GCTATTGAAG GTGATAAAGT ATGATAGGTA AAATAATAAA TGAACGATAT 1140 

AAAATTGTAG ATAAGCTTGG CGGCGGTGGC ATGAGTACCG TTTATCTTGC TGAAGATACG 1200 

ATACTTAACA TTAAAGTTGC AATTAAGGCG ATTTTTATAC CACCTAGAGA AAAAGAAGAA 1260 

ACATTAAAAC GTTTTGAACG AGAAGTACAT AACTCATCAC AGCTATCACA TCAAAATATA 1320 

GTAAGTATGA TCGATGTTGA TGAAGAAGAT GACTGTTACT ACTTAGTAAT GGAATATATC 1380 

GAAGGTCCGA CTTTGTCTGA GTATATTGAA AGTCATGGGC CATTAAGTGT TGACACAGCG 1440 

ATTAATTTTA CGAATCAAAT ATTGGATGGC ATTAAACATG CGCATGATAT GCGTATTGTA 1500 

CATAGAGATA TTAAGCCACA AAATATATTA ATTGACAGCA ATAAAACGTT GAAAATATTT 1560 

40 GATTTTGGAA TTGCTAAAGC TTTAAGTGAG ACGTCTTTAA CTCAGACTAA TCATGTGTTA 1620 

GGTACTGTGC AGTACTTTTC GCCAGAACAA GCAAAAGGTG AGGCAACGGA TGAATGTACA 1680 

GATATTTATT CTATAGGTAT kGTGTTATAT GAAaTGCTTG TTGGTGAACC ACCCTTTAAT 1740 

GGAGAAACTG CAGTTAGCAT TGCGATTAAA CATATTCAGG ATTCTGTGCC AAATGTGACA 1800 

ACAGATGTAC GTAAGGATAT TCCGCAATCT TTAAGTAATG TCATTTTACG CGCTACAGAA 1860 

AAAGACnAAG CGAATCGTTA CAAAACAATT CAAGAAATGA AAGATGATTT GAGTAGTGTT 1920 

TTACATGAAA ATCGAGCGAA TGAAGATGTC TATGAACTCG ATAAAATGAA AACGATAGCG 1980 

GTACCTTTGA AAAAAGAAGA TCTAGCAAAG CATATTAGTG AACATAAGTC GAATCAACCT 2040 
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w 



15 



20 



AGCCAGAAGG TACGGTGTAC GAACCAAAAC CTAAAAAGAA ATCAACACGA AAGATTGTGC 2160 

TCTTATCACT AATCTTTTCG TTGTTAATGA TTGCACTTGT TTCTTTTGTG GCAATGGCAA 2220 

TGTTTGGTAA TAAATACGAA GAGaCACCTG ATGTAATCGG GAAATCTGTA AAAGAAGCAG 22 SO 

AGCAAATATT CAATAAAAAC AACCTGAAAT TGGGTAAAAT TTCTAGAAGT TATAGTGATA 2340 

AATATCCTGA AAATGAAATT ATTAAGACAA CTCCTAATAC TGGTGAACGT GTTGAACGTG 2400 

GTGACAGTGT TGATGTTGTT ATATCAAAGG GCCCTGAAAA GGTTAAAATG CCAAATGTCA 24 60 

TTGGTTTACC TAAGGAGGAA GCCTTGCAGA AATTAAAATC GTTAGGTCTT AAAGATGTTA 2520 

CGATTGAAAA AGTATATAAT AATCAAGCG 2549 
(2) INFORMATION FOR SEQ ID NO: 626: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2286 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY : linear 
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. (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 626: 

TGCTTACTTC GCCTTCAATA CGTACTAATT CATGTCCACA ACTTGGACAA TGGGTTGGCA 60 

TATGATATGT GACAGCATCC TCAGGTCTAC GTTCTGGAAT ACTACGTACA ACTTCAGGTA 120 

TGATGTCACC TGCTTTTTTC ACTACAACAC TATCACCAAT TCGAATATCT CTGTCATGAA 180 

TTAAATCCTC ATTGTGCAAA GATGCTCTTG aTACAGTTGT ACCAGCTACT TTTACTGGTT 240 

CTAAAATAGC AGTAGGTGTG ACTACACCTG TTCGTCCAAT ACTTAATTCA ATATCTAATA 300 

ATTTAGTTAC TACTTCCTCA GCTGGAAATT TATAAGCAAT GGCCCATCTA GGAGATTTTT 360 

GTGTGAATCC CATCTCATCC TGTTGATCTA AATCATTAAC CTTAATAACA ATCCCATCAA 420 

TATCATAAGG TAATGACTCT CTTTGGCTTG TCCATTTTTC AATATACTCT AAAACACCAT 480 

CGATATTATT TACACGCGCT CTATTTTTAT TCGTTGTAAA ACCTAATTTA TCTAACTCAT 540 

CTAATGCTTC ACTTTGCGAA CGCGCATTGA AATCAGTGAA ATCATTGACA CTATATATAA 600 

ATACGCTTAG CTTTCGTTTT GCCGTTAATT TAGAATCTAA CTGTCTTAAT GATCCCGCAG 660 

CAGCGTTTCT TGGATTnGCA AATAACTGCT CATCATTTTT TTCTTTTTCT TCATTTAATC 720 

GTAAAAATGA ACGTCTCGGC ATATATGCTT CACCACGAAC TTCTACATTT AATGGtTCTT 780 

TCATTTTCAA AGGTATCGCA TGAATTGTTT TTaAATTTTC GGTAATATCT TCACCTGTTG 84 0 

TTCCATCACC ACGTGTTAAA CCTTGaACGA AGTATCCATC AACATATTTC AATGATACTG 900 
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GTTGGTCGAA TTTTCTCAAA TCATCCTCAT 


TAAATGCATT 


CCCTAAACTT 


AACATTGGCG 


1020 




TGTCATGGTT GACTTTATTG AAAGAGGCTT 


GGGCTTCACC 


GCCAACTCTA ACTGTTGGAG 


1080 


5 


AATCTACAGT CTTATACTCA GGATGCTCCt 


CTTCTATTTT AATCAGTTCA 


TGAAGTAATT 


1140 




TGTCATATTC ACTATCTGGT ACAGATGGAT 


TATCCTCTAC 


ATAGTATTCA 


TAACTGTATT 


1200 


10 


GATTTAATAA ATCATGTAAC TCGTTCACAC 


GAGACGATAA ATCAGCCATC 


CCTTAATCCT 


1260 


CCTTTTTTtC AATTGGTGCA AATTGCGCTA 


ACAAACGTTT 


TGGCCCTTGT 


GATTTAAAGA 


1320 




TAATATCTAG TTCGATTGAG CCATTTTTCT 


CGTTTACATT ACTCACCATG CCTTCTCCCC 


1380 


15 


AGGCTTTATG CATCACTTTG TCACCTACAT 


TCCAATCAGA 


TGACAATACT 


TGTTTTTTCG 


1440 




TTGACGTTGT TCGTTGACTA AATCCGCGTT 


TAGCAAAAGG 


TTTTGCCTTA 


GGTTGTATCG 


1500 




TTTGTCGTTT GCCACTTGAA TGATTTTCTA 


ATAGTGATTC 


TGGAATTTCC 


TTTAAAAATC 


1560 


20 


TGGATGGCAT ATTTGACTGA GGGCGACCAA 


ATAACATTCT 


TGATGTCGCA 


TGAGTGATAT 


1620 




ATAACACCTC TTCAGCCCTT GTAATTGCTA 


CATAACAAAT 


ACGACGTTCT 


TCTTGCATTT 


1680 


25 


CATGATCATC TTCACTCTTA ATCGCTCTAA 


TATGTGGGAA 


TAAAGATTCT 


TCCATCCCCA 


1740 


TTATAAAGAC AATTGGAAAT TCAAGGCCCT 


TAGCCGAGTG 


CATCGTCATT 


AGTGTTACGC 


1800 




CATTTTCAGT ATCTGCCTCA TCAATATCAG 


CTACTAACGA 


TAAATCCGTT 


AAAAAGTTAA 


1860 


30 


TTAATGACTG TTCTTCTAAT GGGGTATTTT 


CCTCATAGTC 


TTTTGGTACT 


GAGATAAATT 


1920 




CATCGATGTT TTCTAATCTA CTTCGAGATT 


CTAATGTATT 


TTCACGTTCA 


AGCATTTCTC 


1980 




GATAGCCAGA CTTTTGTAAT ACTTCATCAA 


CTATTTCATG 


AATTTCTAAA 


AATTCTTGTT 


2040 


35 


CTTTTATCAA GCTTTGGATT AACTCGTAAA 


AATTAAGACA 


CTCTTGTGTC 


ACCTTTTTTG 


2100 




aCAATCCGAT AAAATCAGCT TCTCCAAGTG 


CATCAAACAT 


ACTGATATTG 


TTTTGAAGTG 


2160 




CATAGTTTTG AACTTTTTCA ACAGATGAAG 


GACCTACACC 


TCTTTTTGGA ACATTaATAA 


2220 


40 


TACGTTGCAA ACTAATGTCA TCATTACTAT 


TGGCAATTAT ACGCAAATAA CTTAATAAAT 


2280 




CTTTGA 








2286 



(2) INFORMATION FOR SEQ ID NO: 627; 

45 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 400 base pairs 

(B) TYPE : nucleic acid 

(C) STRANDEDNESS : double 
« (D) TOPOLOGY: linear 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 627: 
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TGACATTAAA AGTTGGGTGA AnAAACAAGG CATACTTTAG TTAAGCTTGA TGAAAATAAC 120 

AATGGAATTA ATGCGATTAT TCAAAAAGAA AAAGCAAAAG ATTTAGATAT AAATTATTCT 180 

5 ' GCTAAAGGTA CTACCAATTG TATTATTTAG TGGAGAATTA GACAAGCTGT AGCAGCGTTG 240 

ATTATTGCGA ATGGTGCTAG AGCTGCTGGA AAAGATGTAA CTACCTCCTT ACTTTTTGGG 300 

GGCTTATGCC nTTAAAAAAG TGCCACCGTT AATGTTAAAA GCAGTTGCCA AAATGTTTGA 360 

10 

TTnATGTTGC CCCAAAAGAT TTACGATGCC CCTTCCCAAA 4 00 
(2) INFORMATION FOR SEQ ID NO: 628: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4 53 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

20 

(xi)' SEQUENCE DESCRIPTION: SEQ ID NO: 628: 
AATAATTTGG GCGCTnTTTG CGTCGGGATA TTATACCGCT TCCTTAATTG TTCAACATTG 60 
25 TAATCACTGT TTTTCAATTG ATATTTTGCA GAGTAAATTG GTACTTCTGG GTTATATGAC 120 
ACTTCGTCCT CTTTATAGTT TTCCAATTCT TTGAAATTCC CGTATTGTAC AAAGAAGTTA 180 
AATTCTTCGA TTTCTTTTTT TACTTTTTCG TCATCGATTG GTTTTAATGG AATCATTTTA 240 

30 

TTAkTTTCCA TTTTCACAGG ATATCTTTTT GTATGATTGT GTGTCATTCC ATCGCTATCT 300 
TCAACAACTT CTCTAACAAT ATAATGCCCT TTAGCCGTTC TAGTATTTCT GTTAATTTCT 360 
35 AAAACTGCTC CTCTrGATTC CAGATTTTCT CCTTTTAATT GGATTTTCAT TTCAGATCTA 420 
ATTAGcCAAG TACCTTTATC ATCTtTTTTA AAT .453 
(2) INFORMATION FOR SEQ ID NO: 629: 

40 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1221 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

45 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 629: 
TCATATGCAT TTGCAAAATA AACGCCAGAA GCAAGGTTTA GAATTGGGCC GTCCGTTTTG 60 

50 

CTCAaTTCAC TTGcATTCAA TAATTCATGC TGATCATGAT CAATTTGCTT ATCTAATTCT 120 
GCaATTTTCT TCATTTGCTT ATCTGATTTG TTTTCTTTCG CCATCATTTG ATCACGACGA 180 

55 
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GCTAATGGTA CTAATACTTT ATCTCCATAT GTGTCAATAA AGTTATAAAA ATAATCATCT 300 

GTTTTTGATA CAAATCCAGC ACGCTCTTCA GTTTCACGAT ATAAATCTAA GAAAAGATTG 360 

5 

AACTCATCAC GTTCAAGGAA TCTGACTTTA ACACCATAGT TTATCGCTTT ATTAATATTA 420 

CGTTTACGTT GACTATCAAA TGTCTTTTTC AATGTTTCGG GTGTTTTACC TTCAAGGTTT 480 

AATACGCCCA TCCATCGTAC TTGGCTCGAT GTATCATACT CAGTTGTAAA GCCATGATGC 540 

10 

TCGTAACCAT GTGATTTAAA CAAGTTTACT AGGGCATCAT TTTTCTCGCG ACCTTCAAAT 600 

GGCACGATAT CTTTATCATA TAGATGATAT AACCAATACG GATCTAATTT AACATATAAA 660 

15 CATTGATGTT GCTGTAAATA TTTATCTAAC TCTTTTAAAT AATAATCAAC TAATCCTAAA 720 

TCTGAAAAAT CCATTACTGG ACCACGATTC GAATAGTAAA CATAACTTCC CATAGTAGGA 780 

ATTTTAGAGA AAAGGCTTGC TGCAATTACT TTGTTATTGT CGTCTTTAAT ACCTAATAAA 840 

20 ACTACTTCAA AGCCATCATT CTCACGGGTA ACTATATTTT CTTTTACTTG GAAATAATGA 900 

CTTTCCAATG ATGGATTTTG TACAAAGTTG TCAAATTCGG TAACAGTTAA CTCTGTAAAT 960 

TTCATGTTTT GATAATTCCt TCCTAAAAAA TTCTGTCTTT AACTTTTTTA AGTGCGGTAT 1020 

25 

ATGCTGCGTA AACAGGTTTA TTAATTGGTT TAATAAAGTC ACCAACATAT TCmATAATTT 1080 

CAGCATTGTA ACCTTTTTTG AATTTAACTA CACCAGCATC TTCAGCATCT TCTGTAAATT 114 0 

TrCCACTAAC ACCATAGAAA TTATAACGGT CAATGCATGA TTTAATGCAT AATTAATCAT 1200 

30 

TTCCCATTGC ACTGCATAAC T 1221 
(2) INFORMATION FOR SEQ ID NO: 630: 

35 (i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 1121 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDN ESS : double 

(D) TOPOLOGY: linear 

40 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 630: 
TGGCCCAAnT AACACAAGTA ATTGCTGCTA 

45 

. CTACAAATGT TAAACCTTGG AATACACCAA 
TATTGTGAAT. CCAAGTAATA ATAGCTGAAA 
ATGTGGCAAT ACCTGCAATT GATTTTAAAC 

SO 

TAGCGCCAAA CGTATGTGGC CATTGTGTTA 
AGTAACCCAT CAATGCTGCA AGTGCTGCAT 

55 



ATGGTAACAT CACAAAAAAT 
CCATTTCTGG TAATCGTTTA 
TAATAATACC ACCTAGAATA 
CAGGTACATT TTCAACGCCT 
AAATGGCATT TATAAATGTA 
GACCTGGTGC TTTTTTAGCT 



GAAATCGTAA 60 

CTATAGTATC 120 

TTCGTATCCA 180 

TTTTCTAAAT 240 

TTAAACATTA 300 

AAAGAAAGTG 360 
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TTACTGACCA AAATTTAAAC 


CAAAACGTAT 


GTTGATCTGC 


TAAACTCCCC 


ATGATTGTAG 


480 




GATTTTTAAA TAATGTCGCA 


AAGCCAAGCA 


CTATCCCAAA 


GAAAGCGAAC 


ATTAATACCG 


540 


5 


GTACAATCAT TGCACTACCG 


AAACGCTTTA 


TCGCATTCAT 


CTTCTATTCC 


CTCCATATCA 


600 




TCTTTCCTAA 


CAATACATCT 


AATTAGATTC 


ATTTATAAAT 


AGATGTCTTA 


CTATTTAAAT 


660 


10 


ATAATATATA 


GTAAACGCTT 


ACACACCTAC 


AACGACATTG 


ACGTATTTTG 


AAAGTATTTT 


720 


GTATAATCAG 


ATTATCTTTT 


CATATAGTGA 


AAATTTTTTC 


ACGACCTTAT 


ATATGACATC 


780 




GTTGTATTTG 


TAATACATTC 


G'lTlTAAACG 


CATAATCAAA 


CCTATATCAA 


TACACAAATA 


840 


15 


TATATAATGA 


CATACAAGAT 


TTTAATGTAA 


TAACGATCTA 


TTACACATTT 


ATTTTCAAGG 


900 




AGGTTGAATA 


TGTTTTTAGA 


TGAACACATT 


AATCGAAACT 


TTGATAAACT 


TAATGATAAT 


960 




GATTTACATA 


TCGCTCACTT 


TATCAATACA 


CATATAGATG 


AATGTAAAAA 


TATGAAAATA 


1020 


20 


CAAGATTTAG 


CGCAATTCAC 


ACATGCCTCG 


AATGCAACCA 


TTCACAGATT 


TACACGCAAA 


1080 




TnAGGTTTTG 


ACGGTnATAG 


TGGATTTAAA 


TCGTACCTTA 


A 




1121 



(2) INFORMATION FOR SEQ ID NO: 631: 

25 . (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 4 005 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) . TOPOLOGY: linear 

30 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 631: 
AACCTTCCAT TTTACTTGAT CGATAACATC 

35 

TGCGTCTTAA AACCATGAAA TTTAACATGT 
CGATATTCTG ACAAACCATT TCCATGTCCA 
40 GTTACTAATT GCTTGATTAC TTCAATTTGA 
GCAATTGATA TGATATGATT TTTCTCCTTT 

GCCACGTAGC CAACCGGAAT ATTGATAACT 

45 

TCTTGGCATT GCTTTTCTGT TGATACAACA 

ACTGTTTTAT AAAAACTTTT TATACCATTA 

ACAACAATAA CTGGAATACT TTGATTTAAT 

50 

CGATCTAATA TGATTTGATC ATTATTTTTA 
TCATCTTCTG TATCAAAAAA TTGTTGATGC 

55 



AGTTCTGOTT TACAAATCTC TTCATTAATA 60 

TCCGATAAAT GATAATCTTC TACAAGTTGT 120 

TAAATATTCA ATTGAATATT GGGATGTTTT 180 

TGTTTAATTT GTTTATTTTC AACGAGGCGA 240 

TGATTGATGT CAAATTGATA CTTTAAATTT 300 

GGTATTTTAT TTTCAATATA TTGTGAAATA 360 

ATCGCTTTAT AACGTGTTAA ATTATTAAAC 420 

CCGGCACCGG ATAAATGTGT ACTATGGAGC 4 80 

CCCGCTATAA CATTTCCTAA TTCATGAGGA 540 

CATAATTGAT GGAGAAAATA TTGAACTAAT 600 

TGGTCTTCAT TTAAGATAAC CTTTGTGAGC 660 
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TAGTAATTTT CGAGTACAAT CCGTTGTCCT 
CCTCTTCCAT CATACAATTC GCGTTTTACT 

5 

TAATTTAATT GATGATACTG TTTATCTAAA 
TCATATATTC TGACATCATT TGAATTTTCC 
TCCCAATACT GTATCCAGTT AACTTGCTTT 

10 

TAGTCATACA TTGTAAATAC ATCATTTTCA 
TAAGGATTCC ATTTAACATA TACACATTTT 

, 5 AATCTATTTA TTTGCGCTTT TTCTACACCT 
ATGTAATTCA TATTATCGCC TCATATAAGT 
ATGAAAAATA CATCTATTGC ATGTGTAATT 

20 CATATTGTAT TATTTGTTTT GTTTTTTGCG 
TGCAAATAAT CGACCAAATA ACGTTGCGTT 

TGGTAATGCT TTTGCTTTAT TGTGATGGTC 

25 

ATGTTTTCCT GCATCCGAGT CTGAATCGCT 

ATCAGAGTCT GAGTCGCTGT CCGAATCTGA 

ATCTGAATCA CTGTCTGAGT CTGAGTCGCT 

30 

GTCGCTATCT GAGTCTGAAT CGCTGTCTGA 
ATCTGAATGT GAGTCGCTGT CTGAGTCTGA 

35 GTCCGAATCG CTATCTGAAT CTGAGTCGCT 
GTCGCTATCT GAGTCTGAAT CGCTGTCCGA 
GTCTGAATCT GAATCACTGT CTGAGTCTGA 

40 GTCACTATCT GAGTCTGAAT CGCTGTCTGA 
TGTGAAATCA TCATGATCCG TAATTGTTAC 
ATCTTCAGTT GTATTTGTAA CTGTTTGTGT 

45 

GTATTTACCG CTATCTAAAT TATCAAAGCA 
TCCAATTACT TCGCCTTTTT CATTTAATAA 

so AGTTGAATCT TGTTTGCCGT CTTTATTACT 
TTTTGGTGTT TTATAGAAAC CACTGTCTAA 
TGTTGTTGTT AAACCATTAG AATCTTTTTC 

55 . . - 



TCACCTAAAA TTCGAGAACA ACTTAAAAAG 780 

TTTCTTCTTT TATGATCAAA ATAATTCACA 840 

AAATGAGCAT ACATTACAAA TTGCTCTTCA 900 

ACAAATTTCA ATGTGTACCT ACATGACTTT 960 

GTCTTTTTAT AATTGATTGC TTTTTGAAAA ~ 1020 

ATCTGATGTT GCTTCGCATA TGTGTATGAA 1080 

GAAGATATGC CGTGTTGTTT GAACAACTTC 1140 

GTAATTTTAC TTTCTAAAAT TGTTCCTAAA 1200 

TTTATTCCGT ATCTTTATTG TTT ATTTT AT 1260 

ATAAAAAAAC CAGGCCACAA GGACCTGGGT 1320 

ACGACCGAAT AACAATAATG AACCTAATGC 1380 

ATTTGAGCCG TTATTTTCAC TACCTGTTTC 1440 

TTTAGTAGTA CTCATTGGTT TAACAGGTGT 1500 

GTCTGAATCA CTGTCTGAGT CTGAGTCGCT 1560 

GTCGCTATCT GAGTCTGAGT CGCTGTCTGA 1620 

ATCTGAGTCT GAATCGCTGT CTGAATCTGA 1680 

ATCTGAGTCG CTATCTGAGT CCGAATCGCT 174 0 

GTCGCTATCT GAGTCTGAAT CGCTGTCTGA 1800 

GTCTGAGTCT GAATCGCTAT CTGAATCTGA 1860 

ATCTGAGTCG CTATCTGAAT CTGAGTCGCT 1920 

GTCGCTGTCT GAGTCTGAGT CGCTGTCTGA 1980 

TGTATCTTCT TCGAAGTATC CGTTATCAAG 204 0 

GTCAACTTCG CCACCATCTG CATCTTTATC 2100 

TAAGCCAGCA GGCTTTTCAA AAATAACTTT 2160 

GTATTTACCA TTTTCATCTG TTTTAGTTGT 2220 

AGTAACTTTA ACATCTTTGA TACCTTTTTC 2280 

GTCGTACCAA ACATAATCAC CTAAACTATA 234 0 

TGTCATGTTA TCTGCATCTT TAATGACACC 2400 

AGTATCATTT CCAGAAGTTA CTGAAGTTGG 2460 
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5 



10 



15 



20 



25 



30 



35 



TTGATATTTA 


CCATTTTCAT 


CTGTTGTAAC 


TGTTTTTAAA 


ACTTTGTCGT TTTCATCTTT 


2580 


TAACGTAACT 


GTTACACCTG 


AAATGCCCTT 


TTCATCTTTA 


TCTTGAACAC CGTTTTTATT 


2640 


TGTATCTTCC 


CATACATAGT 


CACCTAAGTT 


GTAAGTCGGT 


TTGTAGAAAC CAGAGTCAAT 


2700 


AGTATCGTTA 


TCTTTATCTT 


TAATGACACC 


TGTTGTTGAT 


GTACCATTTG AATCTATACC 


2760 


TTCATCAGTT 


CCTGAACCTA 


CTTGTGTTGG 


TGTGTAACCT 


GATGGTGTTT CGAATTCAAC 


2820 


TTTATAAGTT 


CCATTTTCTA ATCCAGTAAA 


TTGATATTTA 


CCATCTTTAT CTGTTTTAGT 


. 2880 


TGTTTGTAAA 


ACTTCACCGT 


TTTCATTTTT 


CAATGTAACT 


GTTACGCCTG AAATACCTTT 


2940 


TTCAGTTGAA 


TCCTGCTTAC 


CATCTTTATT 


TGTATCTTCC 


CATACATAAT TACCTAAATT 


3000 


ATATTTTGGT 


GTTTTGTAGA 


ATCCACTATC 


TAATGTCATG 


TTATCAGGAC CATTAATAAC 


3060 


ACCTGTTGTT 


GTTAAACCAT TAGAGTCTTT 


TTCAATGTCG 


CTACCAGATG TTACTGTAGT 


3120 


CGGTGTATAG 


CCTTCTGGTG 


TAGTAAATTC 


AACTTTATAA 


TTACCATTAT CTAAATCAGT 


3180 


AAATTTATAT 


TTGCCATCAG 


CGTCTGTTGT 


AACTGTTTTT 


AaCAgTTACC GTTTTCATCT 


3240 


TTTAATGTTA 


CCGTTAOGCC 


AGATATACCT 


TTTTCATCTT 


GGTCTTGGAT ACCATTTTTA 


3300 


TTTGTATCTT 


CCCAGACATA 


GTCACCTAAG 


TTGTATTTAG 


GTTTGTAAAT ACCTAAGTCT 


3360 


GCAGATAAGT 


TATCTTTGCC 


ATTAACTGTA 


ATAACTGAAG 


ATAAGCCGTT TGAATCTAAT 


3420 


TCTTCGTTAT 


TACCTTGTTT 


TGAAGGGGTT 


ACTTCATAAC 


CTTTTGGTAA GTTTGAAAAT 


3480 


TCTACACGGT AATCTCCATT AGGTAAGTTT 


GGAATCAAGT 


ATGACCCATC TTCTTTAGTA 


3540 


ACTGCTTCTC 


CTACTTTTGT 


ATTTGTATTA 


TTATCAAATA 


CAGTTACAGT TACATTGCCA 


3600 


ACGCCTTTTT 


CTCCTAATTC TTGAACACCG 


TTTTTATTAG 


TATCTTCCCA TACGTAGTTA 


3660 


CCAATTTTAT 


ATACTTCTTG 


ACCAGctCCG 


CCACTTTGGT 


TATTAGTAAA TCCTAAAGCA 


3720 


TTGCCAGTAG 


AAACGGATTT 


ATTACCTGTT 


GAAGATAAAG 


TAGCCATTTG AACAAGTGTT 


3780 


GGGCTTTCGC 


TATTTGTATA 


TTGGAATTTT 


GTATTAACCA 


TTACAACATA AGCAGAATCT 


3840 


GCATTTCCAA 


AATCAATAAC 


AGCGCTATTG 


TtGTCGCCAT 


ATGTAATTTT CTGCAAGTAT 


3900 


TGATTTGTTA 


CATCTGTAAG 


CTCTTTAGTA 


TTCACATCGT 


ATCCTTTATT TAATGTATAA 


3960 


CCTTTAGGAA 


CTTGATATAT 


TTTTATATCT 


GTTACATCTT 


TATTT 


4005 



(2) INFORMATION FOR SEQ ID NO: 632: 

(i) SEQUENCE CHARACTERISTICS: 
50 (A) LENGTH: 1440 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



55 
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10 



15 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 632: 

TATTAGGTTA CTCTAGTTTC CAAAGCGGGA ATTTTAATGT TATTAACAGC AAGGACAGCA 60 

AAAGCAATAT CGGCGCATTG ATTGAAAATC CAGGAATATA TCCTTTTATG TCTGGATATG 120 

AAAACTTGAA GTTATTGAAT GAATCAAAAA ACACTCAAGA TATCGATAAA ATTGTCTCAC 180 

AACTTCATAT GGATGAATAC ATTCATAAAA AAGCTAAAAC GTATTCTCTT GGTATGAAAC 24 0 

AAAAATTAGG AATTGCTATA GCATTTTTAA ATAAACCTCA ATTCATTATC TTAGATGAAC 300 

CAATGAATGG CTTAGATCCA AAAGCTGTGC GAGATGTACG TGAATTGATT GTCCAAAAAG 360 

CGCAAGAAGG TGTTACTTTC TTAATTTCGA GTCATATTTT AAGTGAATTA GTTAAAATCA 420 

CAAACTCTAT CCTTATTATT AACAAAGGTA AAATTGTTAC AGAAACATCG GAAGAAGAAC 4 80 

TTAAACAATT TAAAGATAAT GATTTAGAAA ATGTATTACT AGAAATCATA GAAAGGGAGG 540 

20 ACCAAGCATA AAATGGGAAC TTTAATTAAA CAAGAATGTT TCAAATTATT TAAAAAGAAA 600 

TCAACTTTTA TCGCACCTAT TGTCTTTATT CTACTAATGG TTGCTCAAGG TTATATTGCT 660 
ACAAAATACA ATGAAATTTT TACGCCACAG GAATCTTTCA CATCTGCTTA TAATGGTTTT . 720 

TCATGGTTTG CATTTTTATT AATTATTCAA GCAAGTACAA TCATTTCAAT GGAATTTCAT 780 

TACGGTACGA TTAAAAATTT ACTCTATCGT GAATATTCAA GAACAACTAT GATTGTTAGC 840 

AAAATCATCA CATTATTTAT TATTTCTTTA ATTTATTTTG TTATTACAAT TATTGCTTCA 900 

ATTGTTATTG GGTCTTTATT CTTTAATGAT TTAAATATAT TTGAAAGTAG CGGTAATCAA 960 

TTATCTTTAT TGAATCAATT ATTATTAGTT AGTTTAGGCA CATTTGTTGG CGTTTGGTTA 1020 

GTTTTAAGCT TAACGTTGCT ATTATCATCT GCAACAAATT CAACGGGAGT AGCCATTGCT 1080 

GTAGGTATTG TTTTTTATTT TGCAAGTTCT ATTTTAGCAG TTATTCAAAC GG CACTTTTA 1140 

GAAAAAATAG ACTGGCTAAA GTGGAATCCT ATTAATATGA TGAATATTAT GCTTCAAACA 1200 

40 GTTGAAAAAG GCTTTAGTAA GTCGACAAAA TTAGAACTTC ATGAATTGTT TATTGGTAAT 1260 

ATTGCTTATA TTTCTATTTT CTTAATACTT GTAGTATTTA TTTTCAAGAA GAAAAATATT 1320 

TAGTAACTTA AAGTATTAAA TGTCTAAATA CACACATATT CCATCGTAAT TCAAAATCAT 1380 

TTTCAAATCC CTTCACCCAA ATAATGGTGC GGGGATTTTT TCATCCAAAT TTTGGAAATT 1440 
(2) INFORMATION FOR SEQ ID NO: 633: 



25 



30 



35 



45 



50 



55 



(i) SEQUENCE CHARACTERISTICS ; 

(A) LENGTH: 1323 base pairs 

(B) TYPE: nucleic acid 
<C) STRAND EDNESS : double 
(D) TOPOLOGY: linear 
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(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 633: 

GCTGACATAA TTGCATCAAA TTTCACATCC CCATAAAAAT CGCTACCACA TAACCTACGA 60 

5 TAATACCTAC AAGAACTGGA ATTAAAGATA GGAATCCTTT AAAAAATCCT TGAACGACTA 120 

TTGTTACAAG CAAGGTTATC ATTGCAACAA TTAAGAAACT GATATTGTAA CCTTTCATAT 180 

CTCCAGGATT TTCATACATT GCCATATTGA CTGCAGTAGG CGCTAAGCTT AAACCAATTA 240 

10 

CCATGATGAC TGGTCCAACA ACAACTGGTG GTAATAATTT CATTAACCAT GCTGTCCCAC 300 

TTAATTTGAT TAGAATCCCG ATGATGACGT ACATAACACC ACTCATGaAT AATGCTACAA 360 

15 GCATGTCTCC TAAGCTATGC GTACTTAATC CCGTGATAAT TGGCGTGATA AATGCAAAGC 420 

TAGATCCCAA GTATGCTGGT ATTTGCGCCT TCGTTATTAA GATATAAAGT AATGTACCGA 480 

TTCCCGAAGC TAGTAACGCT GCTGATATTG GTAGTCCTGT TAAGAATGGT ACTAGTACTG 540 

20 TTGCGCCAAA CATCGCAAAT AAATGTTGTA AGCTTAAAAA TGCCCATTGC GCTGGTTGTG 600 

GTTTTTCATT TACATCTAGT ACGGGTTTTA CTGTTCGTTC AAACATTTCA TCATTTTGCA 660 

TAATATTCAT TTCCTCCGAT AATAAAAAAA TCTCTTTACA TCAGTATATG TAAAGAGACA 720 

25 AAAAGTGTGA CAAGTTGCTA CAAGTCATTT TCGTCCATAG AAATTGACTT ATAGTTGTCG 780 

AACATGAGGG TATTATTAGA TAAACAAGCA TATGAAAACT TATTTATCAT TCAACTCCCC 84 0 

V 

CACCTTTTTC AGTCTCTCGT ACTGAATTAA AAGGGGtATT ATTTAATTAT AACTGCATTT 900 

30 

CTTTGATCcA TTtCTTCyAA ATAGACACTT ACCGTTTCCT CTTTAGAAGT AGGTAwATTT 960 

TTACCAACAA AATCTGCTCG AATTGGTAAC TCACGATGTC CTCGATCAAC CAAAGCAGCT 1020 

AAACCAATTT TAATAGGTCT AGCATTTAGC AAAATAGCAT CAAGTGAAGC ACGAACCGTT 1080 

35 

CGACCAGTAT ACAGCACATC GTCAATAATG ATGACTACTT TATCTGTAAT ATCTGTGTCG 1140 

ATGTCTATTG CGTCTTTTGT CGTAAGTGAT GACATGTGcT CTATATCATC TCTAAAGTAT 1200 

40 GTAATATCAA TTGTTCCAGT AGGTATACGT TGTTGCTCAA TTTGATGAAT TTtATCTTGT 1260 

ATACGATTCG CTAAATATTC ACCTCTTGTn TTGATACCTA AAAGATTAAA TTATCAGTAC 1320 

CTT 1323 

45 . (2) INFORMATION FOR SEQ ID NO: 634: 

(i> SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 761 base pairs 

(B) TYPE: nucleic acid 
so (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



55 



1561 



EP0 786 519 A2 



ACCCATCTCA TCGTATTTTG AATTTAATAG ACGAGATCGA TGTATATCTG AATTCATCCC 60 

AACTATGGAT TAATGTTGGT ACATCATtAA cGCATAACCA ACATTTTGAG CAGTTGTTTT 120 

5 ATAAGTAACG TGATTTTTAT CTAATTGCCC TCTTAATGCG TCCTCTGTAA ATTCAACACT * 180 

ATCAGAACCA TTAGAGGTCG CTTCATATAA GTTATTAGAT GCAATATGTG CTAAATCGCT 240 

ATTGATTTTC AATGGTTTTA ATCCTTTTAA TTTTCTCATT TCATTCGTTA CTTCATAAAG 300 

10 

AGAAATTAAT TGATTTGGAT TTTGCTCAAC TGGACGCTTA TTATGCTCTT CTGACGTAGA 360 

ATTAGAATTT AATTGATAAG GTTCAATATC TGCTAACATT TCTTTTGTTA AAAATCGTAC 420 

r5 ACTTAGCACC TTTTTCGATT GTTGATCAGA ATACACTTGT GCATATATGT CGCCATATTT 480 

AATCaGTGTT TGTGTTTTTA AATCTTCATC TGAAAGTTCA AATTCATATT TTTTACCATC 540 

AACTTTAAAG GACGGTTCTG GATTAATACT TGTATGATTA AAAATTTCTG CAGAATGTTG 600 

20 TCCTATTTTT AACGGACTAA CATTGACTTT CTCACCTGTA GCATACACTG AAACGATTTC 660 

TTCACGTTTA GTTGAAACAA TGTAATAACT GTTTTTGTCT TTAAACACAT AATTTTTGTA 720 

rCCATCTCTA AAAGGGTAGA CrCGATCTGC TTGTCCAAAT T 761 

25 (2) INFORMATION FOR SEQ ID NO: 635: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 827 base pairs 

(B) TYPE: nucleic acid 
30 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 635: 

35 



40 



45 



SO 



nTAAATATAT 


TTATATATTA 


TAGAATAGAA 


AGACCTGAAG 


ATTGAATATC 


TTTCGCAAAG 


60 


CCTTTAACTG 


TATCTACTGA 


TAATTCGTTA 


ATATCGCGAC 


CTAAGTTTGT 


ATTCACTTTT 


120 


TTCACAACAT 


CTGCTGGGCA TGTAATAATA 


TCTGCACCAA 


TTTCATCAGC 


TTGAATCACA 


180 


TTGAATAATT CGCGGCAACT TGCCCATAAT 


AATTTAACGC 


CGTCTTTACT 


ATGCGTAACT 


240 


TTnACAGCCT 


CTkTCATTAA 


TGGTaATGGA 


TCTACGCCTG 


TAtCTGCAAT 


ACGTCCTGCA 


300 


AATACTGAAA 


CATATGTTGG 


CACACCTTCA 


GTTACTGCTT 


CAGTTATTTC 


TTTAACTTGT 


360 


TCAATTGTGT 


AAACAGCCGT 


AACGTTTAAT 


CTCACATTGT 


CAGCTGAAAG 


TTTTTTAATT 


420 


AAAGGAATCG 


TTGATTCACC 


TTTTGTATTT 


ACAATAGGAA 


TTTTAACAAA 


TAGATTTTCG 


480 


CCATATTGTT 


TTAAAATTGC 


TGCTTCTTTk 


TCCATAGTTT 


CTAAATCGTC 


TGCAAATACT 


54 0 


TCAAATGArA 


TTGAAGCATC 


TGGAATTTCT 


TTCACAGCTT 


CTTCAGCAAA 


AGCTTTGTAA 


600 



55 
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TTTTTATAAG CTGCTTTCAT TnCTTCAATA TCTGCACCGk CCGCAAATAC TTCTACATTT 720 

AGTTTAGCCA TATAAyATAG CCTCCTTGAT TCTTATTAAA ATTTTAACAA CATCTGCATG 780 

5 

kCTTTTTCTT ACAACCATTT GTAAAAAATG ATTTTTATTT CTTtGTT 827 

(2) INFORMATION FOR SEQ ID NO: 6!36: 

(i) SEQUENCE CHARACTERISTICS: 
10 (A) LENGTH: 1478 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS: double 
(D) TOPOLOGY: linear 

15 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 636: 

TTAGTCGGTA TAACCATCGG CTAGGTGGTT TTTGTATTAA AAAAGTGGAT aCCAAAATTT 60 

20 ATTAATAATT ATTTTAATGT TAGAAAAAAA CTAAATAAAA ACTCGCTAAT GATATCCAAT 120 

AATATGTATA CAAAACGAGA CATATATTGC ATATGATTAA CGAGATACTG AAAATATTTT 180 

ATCACCCCTA AAATGATTAT TCATTTTCAG CGGTAATTCG ACCTAAAGTC AAACTTACAA 240 

25 TAAAACCGAT GATAAATACT ACTAATGAAA CGAACCACAT CACGATATTA GTTGGTAAAC 3 00 

CTGGAAATAC TGCAAAGAGG GAGCCAACAA CAAAACCAAT GATTAATGCA AAAGTCATTA 360 

GTTTATGATG TGTTAGGAAA TACTGGATAA TTTTGCTTGA AATAATGAAT CCAGCAAGCA 420 

30 

CGCCAAATCC GACTGCAAGT AATATAGGAA GACCTGCAAA GTTAAGTTTA ACAACTTCAG 4 B0 

ATATTGCTAG CATGACCGTA CCATAGACGC CAAATACTAA TAACATAAAT GACCCTGAAA 54 0 

35 TACCTGGGAG TAACATAGCA CTAGATGCAC ACATACCTGC AATAAAATAT TTAATAATAA 600 

GACTAGTTGA TAGAGTAAGT GTTTCTCCAG CATGTTTATC ACCATTATTC ATTAATGTAA 660 

TAACAATTAA GATAGCGATA CCAGCTATAA CCATCATGTA ATGTyTAGTT GTAAATGACG 720 

40 TTTTATAGTT AGAAATTTTC AATAAATATG GAACGATACC AATGATTAAT CCACCAAAGA 780 

AAAACATAGT TGGAATATGG TGTTGGCTTA ATAAATAATT AAAAAGATTA CTTAGTGATC 84 0 

CCATTGCCAG TAACATTCCA ATTATAATGG GGATTAAAAA TGTAAAACTT GGCCAAAAAC 900 

45 GTCGTGAGAA TATGCCGCTA ATTGAAGCGA TAAATTGATT GTAAATACCT AACAATAATG 960 

CGATAGTCCC ACCGCTAACA CCAGGTACCA AGTCACTCGT TCCCATAGCA AAACCTTTTA 1020 

GAATATTAAT CCATTTAAAT TGTTGCATGA ATAACTCCTT TCAAACGATT GGAATAAAAT 1080 

SO 

CATAAATAGC ATCATACCAT ATTACAAATG TCCTAGTGAA ATGATAACAT ATTTTAAATT 1140 

CATAAAATCC ATTGAGAAAT TATGTGCACT TATTATCATT TATATTTTTA AAGAGAGCGG 1200 

55 
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AGGTATAAGT AAGTTATAAT TAACTGAACG CATTATTACA AAGTCTTTTT GACTACAAAT 1320 

TAAAATTATT ATAAACTAGT TAAGAAAACT TTATATTTTA CGGAGGGAAT ATAAAATGGC . 1380 

ATCAACATTA GAAATyAAAG ACCTACATGT GTCTATTGAG GATAAAGAAA TCTTAAAAGG 1440 

TGTTAACTTG ACAATTAACA CTGATGAAAT ACATGCGA 1478 



(2) INFORMATION FOR SEQ ID NO: 637: 

10 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1995 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ. ID NO: 637: 

20 ATTACAGCAT CTTCTCTAGG TAGATTATTA AAAGATAGAG GTCTAAATGT AACAATTCAA 60 

AAATTCGATC CATACTTAAA TGTTGACCCA GGTACAATGA GTCCTTATCA ACATGGTGAA 120 

GTATTCGTAA nGGATGATGG TGCAGAAACT GACCTAGACT TAGGACATTA CGAAAGATTT 180 

25 ATTGATATTA ATTTAAACAA GTTTTCAAAT GTGACAGCCG GTAAAGTGTA TTCACACGTA 240 

TTGAAAAAAG AACGTCGTGG TGATTACTTA GGCGGAACAG TTCAAGTTAT TCCGCATATT 300 

ACAAATGAAA TTAAAGAACG TTTATTACTT GCAGGGGAAA GTACGAATGC AGACGTTGTT 360 

30 

ATCACTGAAA TTGGCGGTAC AACAGGTGAT ATTGAGTCAT TACCGTTTAT TGAAGCGATT 420 

CGTCAAATTC GTAGCGATTT AGGTAGAGAA AATGTTATGT ATGTTCACTG TACATTACTG 480 

CCTTATATTA AAGCTGCTGG AGAAATGAAA ACGAAGCCAA CACAACATAG TGTTAAAGAA 54 0 

35 

TTACGAGGCT TAGGTATTCA ACCAGACTTA ATCGTTGTAA GAACTGAATA TGAAATGACA 600 

CAAGATTTAA AAGATAAAAT TGCATTATTC TGTGACATTA ATAAAGAAAG TGTTATTGAA 660 

40 TGTCGTGATG CAGACTCTTT ATACGAAATT CCATTACAAT TAAGCCAACA AAATATGGAT 720 

GATATCGTTA TTAAACGTTT ACAATTAAAC GCGAAATATG AAACACAGCT TGATGAATGG 780 

AAACAGTTGT TAGATATCGT TAATAATTTA GATGGTAAAA TTACAATTGG TTTAGTAGGT 840 

45 AAATATGTTA GCTTACAAGA TGCATATTTA TCAGTTGTTG AATCATTGAA ACATGCTGGA 900 

TATCCTTTTG CCAAAGATAT TGACATTAGA TGGATTGATT CAAGTGAAGT AACAGATGAA 960 - 

AATGCAGCCG AATACCTTGC AGATGTCGAC GGTATTTTAG TACCAGGTGG ATTTGGTTTC 1020 

50 

CGTGCAAGTG AAGGTAAAAT TAGTGCAATT AAGTATGCTA GAGAAAACAA TGTACCATTC 1080 

TTTGGTATTT GTTTAGGAAT GCAACTTGCA ACAGTTGAAT TTTCAAGAAA | CGTATTAGGC 1140 
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TTACCAGAAC AAAAAGATAT CGAAGATTTA GGTGGTACAT TACGCTTAGG CTTATATTCA 1260 

TGTTCAATTA AAGAAGGCAC ATTGGCACAA GATGTTTATG GTAAAGCGGA AATTGAAGAA 1320 

AGACATCGTC ATCGTTATGA ATTTAATAAT GACTATAGAG AACAATTAGA AGCAAATGGT 1380 

ATGGTGATTT CTGGTACAAG tCCAGATGGA CGTTTAGTAG AAATGGTAGA GATTCCGACA 1440 

AATGtTTCTT TATTGCTTGT CAATTCCACC CAGAATTCTT ATCTAGACCA AATCGTCCGC 1500 

ACCCGATTTT TAAATCATTT ATTGAAGCTT CATTAAAATA TCAACAAAAT AAATAAATTT 1560 

GCTAATAAAA CCGGTACTTT CATTGTTAAA CATTGAAAGT ACCGGTTTnT CGTATAATTT 1620 

TAATATTATG TTAGTGACAA GGTATGAAAT AACAATAGTG ACTTTTATAA TTCTAAGTCT 1680 

CTTGTCATTT CAATCATTTG TGTATAAATG TCATAGTATA CATAATTCAA TGCCATCGCA 1740 

TGTGGTyGGA CAATCTTATC GTAATCTTCA GTGTAGACTA TAGGTcTTGG TGTAGATAAA 1800 

20 TCGATAAAAT GTACGAGATG ATCAGGGAAA TCATCTGTTT TAGGTTTGTT GCTTATTAAG I860 

ACCACATCGA TATCTAAGTC GATAAGTTTT TGAATATCTA ATGCAACTTG ATyATTATAA 1920 

AATGGTGCGA ATAATAATAC ACGATCAGTT GAGTCAATTT CTTTAAwkTC TTTAATAGCG 1980 

TaAGTTTnCG GCTAG 1995 
(2) INFORMATION FOR SEQ ID NO: 638: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1107 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 

<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 638: 

ATTAGTGATG AAAGTCAGAT TGAAGCTTTA TTAACAGCTG AAAAATATTC AGAAATGATT 60 

GGTGAATAAT CACCGTGTAA CTCCTTAATC TAAGATTGAG GAGTTTATTT TTAGTCTGAG 120 

AAAATAAATG ATATGAAAGA AAAATTATTA GGTACTATTA TTTGGAGTAT TGCTACATTT 180 

TATTATTCAA GAATGATGGA AATAATGAAT TTAGCTATTT TAAAAATAAA AATTGGGGGA 240 

AGTTAATATG CTAAACATTC AAGACGTTAn CATnCTTTCT AAAAAGGAGC AAAAAGCATA 300 

TAACCGTTTC GTAGAATCTG TAGAAAACGG TAATTTACCA GTACTACCAT GTATTGAAAT 360 

SO GGATCTAAAA GAGATGCAAG AAGAAACATT AAACCAGAGT AAGATTGGTG GAATGCCATT 420 

TTTAAAATCT TTTAAAGATA TACCATTAGA TGAAAATAAT GTACCAATGG TATTGCTAGC 480 

ACAGATTAAT TTGGATGATC TTCCAGAACA ACAAGAATTA TTTCCTGTAA AAGAAGGGAT 540 
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AAACAATATA AACTCAAGGC TTGTTTATAT AAAAGAGCCA ATTACAGATT TATCACTCGA 660 

AAATATTCAA GCGCATTTGA AGTCATTAGA TGCTGATAAT GAGGATATCC CGTTCAGTGG 720 

AGCATTTTCT ATAGAATTTA GATTGTCGAA ACAAACTATT ACATGTACTG ATTATAAGTA 780 

CGATGAGGAC GTGCTTGCAT TGTGGAATAA AGTCAATCCA TCCTTCGCGC TAAAATCAAT 840 

GTTTGGTGGT TATGATGAAT TGATGGAACC TGTGTGTAmC AyvTTTACTG CTAAGgAACC 900 

ATTTAATCAA CTTGGTGGTT ATCCATATTT TGACCAAATA GATCCAAGAA CGAACGATcA 960 

AGAACTGAAA ATGTATGATA GAGTCTTACT GCAAATTGaT TCTACAAGAG ATGGTAATTC 1020 

TTCGATTATa TGGGGTGaTT TAGGTATTGc CAATATCtTA GTGaAATCTA CTGrACCTTG 1080 

aGGcTAtGaa GTTTTGAATG ATTACCT 1107 
(2) INFORMATION FOR SEQ ID NO: 639: 

*0 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 904 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 
{D) TOPOLOGY: linear 

25 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 639: 

ATTCATATTA TTATAAATTA TTTCTACACC ATCCCAATTG AGTTGTTTTT CATAATTTAA 60 

30 

ATGTAATTCC ACTAACTCCC TACCAATTTC AACAAATCCA TATACATCCT TTAATATCGG 120 

TATTCGCGGA AAACCTTTAC TCAAATCACT TGAATATTTG TTCACATAAT ATTTATGATG 180 
35 CAAAATTGCA TATATATAAT ATACTATCTC TTCTGAATTA AGATTTATTT TCTTTTTAAA t 240 

AGAATTAGgA AATATTATCT ACArGCCTCA AACTATCTTT ACCTTTGtAT GTAGCAAAGC 300 

CTDcGCCATT ACCAATAAAt TGGAAATTAG GTAATATGTC CGTGATCATA GCCGAGAATT 360 

40 CTTTATTCAT TCCCTGTCCT TGTATATAAA TCACCTGTCC AGTATTCTCC ATTATATTAT 420 

AATATCTACT TGGCATTTCC ATAATATTTT TGTCGTACAC TATCCATTTT TTTGTAAATG 480 

GTCTATGCAT AAATTTAACA ATTCTCTCTG GATTAATTGA AATATTTTTT CCTTTAGAAA 540 

ATTTTTGGGT AAGTCCTCGT GTCCAACTaA TaAATGTTTC ATCTTTGTTC ACTAAATTTA 600 

TACGTTCTCT TGAATCTAAG ATATCAATTA ATCTATCTAT TTCAGAATTA TAGTTATCTA 660 

CAAGTAATTT TGcATTTACT AATGCTTTTT CATTCGAAAA ATTTGTTACC CAATTATCTC 720 

TTGCTGaATT TACTCCATTA AATkGAkCTA AATATATAGA ATTTTCAATA TCCTTGGAAT 780 

CATACATTGG TAAATAATTC CCCATAGTTT ATGTCTCGGT GATTAATCCA ATCATTGGGG 840 
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AAAG 

(2) INFORMATION FOR SEQ ID NO: 640: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 436 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

<XX) SEQUENCE DESCRIPTION: SEQ ID NO: 640: 
CGATGTCTTT ACTATTAGAC TTAGCCATTG GTTTCACCTC TCCAAAAATT GTAAATGTGT 
ATCATCAATA TGAAAGTTAC ATAAAACTGA CATATTTCTT TAAAATATCA ACGCCATTGA 
TAACTTCCTG TTTTAATTGA TACGCTGTAA CAAAATACTA TAGTTAGTGC TTACATGTAT 
ATGTTAAAGC AAGCAGTGGT AAATGTAAAT TATAATTATT CATTAACTTT GCAATATATT 
AAATCTTTTA TTCATAGAAG ATAAATATCA AATCAATCAT AATTATTTGA CAACAAATAG 
CTAACGATTG TTTTAATCTA CATTTGGCTT AT AG CATTTT AAACCTATAC TCTATTTTGA 
TACAATATAA GTGTAAAATC AATCATAAAA AGGATATTCA ATATCTGCAT CCAAGAAAAA 
CATTACAATT ACCTTT 

(2) INFORMATION FOR SEQ ID NO: 641: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 442 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
JD) TOPOLOGY: linear 

{xi> SEQUENCE DESCRIPTION: SEQ ID NO: 641: 
GTTATTAAAT TCAGAGTGGT AGCAAATTAA AGTTAnTCAA GAGTTAAGAT GAATTTAATT 
CATGAACACG TCTATTATTT TTATAATTGT AGCAAATAAA GCTTTACATC AAGGAGGTAA 
TTAAATATGT TCAAAAAATA TGACTCAAAA AATTCAATCG TATTAAAATC TATTCTATCG 
CTAGGTATCA TCTATGGGGG AACATTTGGA ATATATCCAA AAGCAGACGC GTCAACACAA 
AATTCCTCAA GTGTACAAGA TAAACAATTA CAAAAAGTTG AAGAAGTACC AAATAATTCA 
GAAAAAGCTT TGGTTAAAAA ACTTTACGAT AGATACAGCA AGGATACAAT AAATGGAAAA 
TCTAATAAAT CTAGGAATTG GGTTTATTCA GAGAGACCTT TAAATGAAAA CCAAGTTCGT 
ATACATTTAG AAGGAACATA CA 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2472 base pairs 

(B) TYPE: nucleic acid 
<C} STRANDEDNESS : double 
<D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION; £ 

10 

CCAATTTTGG TATGAATTAT ACAGATAATT 
ATCAATTCGG TGTGGATAAA TGGATGAATG 

1S ACTACTGCCA ATAACGGAAG ATATATTTAT 
GTTTCGGGAG CACTAGCTTT AATCATTGAT 
GCGATTGAAT TGTTATATCA GCATGGGACA 

20 GGGCATGGTG AGCTTGATGT GTATAAAGCA 
TAAATCAAAG GAGTTTTTGA TTATGGCAAA 

TAAAAATCAA GATGTATTAA AGCATATTAA 

25 

ATTA.CTTGGT ATTAATGGAG CCGGTAAAAC 

TCAACAAGAT TCAGGGGAAA TTAAATTAGA 

CAAAGTTGGT TCG CTTATTG AAACACCTGC 

30 

TTTGAAAATT GTGTGTTTAA ATGAAAGCGT 
CTTAGTCAAT TTAAATGTCG ATAAAAAGAA 

35 ACAAAGACTT GGAATTGCAA TGGCaTTAAT 
ACCATCTAAT GGTTTAGACC CATATGGAAT 
AACAGAACAA GGTACTAGTA TTATTATTTC 

40 AGCAGATCAT ATCGGTATTA TTCATGAGGG 
AGATGAAAAC TTAGAAGAGA TATTCTTCAA 
TTAAAGATaG AAGGTATCAA ATTTAAAAAt 

45 

CcGcTGGTAT TTCTTTGTTT TGCTATTTTC 
ACAGCGAATA GTGTGTCACC ATATATAACT 
ATCCCGATTG TATTATGTAT GGCTTGTAAT 

SO 

TCATTTAATT ATTACTTAAG TAATAATTGG 
TTCATTTTAT CAATAGCATT TTTGGTACAT 

55 



;EQ ID NO: 642; 

CnGCGCCCGG AGGATCATTT GCTTATTTAA 60 

AAGGGTATAT GGCATAAGGA GAACATTTTA 120 

CAAGCTGGAA CTTCATTAGC CACACCTAAA 180 

i 

AAATATCATC TTGAAAAACA TCCAGATAAA 240 

TCTAAGAATA ATAAACCATT TAGTAGATAT 300 

TTAAATGTAG CAAATCAAAA AGCAAGTTAA 360 

ATTAGTTACT GAAAACATTT CGAAGCGGTT 420 

TATCACTTTA GAAAATAACG AAGTTTATGG 480 

GACACTTATG AAAATTATAT GTGGCATACT 540 

TAATAGACCA ATGACACGAA ATGATTTGCA 600 

GACATATAAT CATTTAAGTG CACAAGATAA 660 

TGATTTCaGC GAAATTAATA GTGTTTTAAG 720 
AAAGGTTAAG GACTTTTCTT TAGGTATGAA { 780 

TAAAAaGCCA GAAATTTTAG TATTAGACGA 84 0 

CCAAGAACTT AGAGAACTTC TAAAATTATT 900 

AAGTCACATT TTATCTGAAA TCCAAGTTTT 960 

TGAGCTAAAA TATCAGCAAA GAAATAACAA 1020 

AATAACGAAA GGTGATTACA AATGATACAT 1080 

TCTTTCAGTA TGTATGTTTT ATTAATAAGT 1140 

ACAGTCTTAT TCGCCAAAAG TAATACGGGA 1200 

TTACTATTTA ATATTTGGCC AATTGCTTTC 1260 

TCGTTATTTA AAATTGAAAT GAGAAATAAA 1320 

TCGATTACAA AAGAAATAAG AGCAAAGATT 1380 

TGCTTTTTAG TATTTATTAT TGCTTATATA 1440 
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5 



10 



25 



30 



TTGATGTATG 


TAGTATCTCT 


ACCATTGATA 


CCGCTCAACT 


TTTTATTAAC 


TCGATACTTT 


1560 


GGTGTGTTCG 


TATCAATATT 


AATAAACTTA 


GTATTATCAG 


TCATTTGTGT 


CTTGTTTTTA 


1620 


ACATTGAAGA 


GTTTATTTTG 


GGTGTTGCCG 


TGGGGGATAA 


TGCAGAGAAT 


CCCGCTTATT 


1680 


ACGCTTGGTA 


TACTACCTAA 


TGGtTTAGTT 


GTAAACCATA 


ATTCAAAATA 


CTTTAATGAT 


1740 


CTCAATGCCT 


TATATATTTC 


GATTATTGTT 


AGCATCATTA 


TTTTCGCGAT 


AGTAACATTT 


1B00 


TTAAATAATA 


AGAAAAGTTG 


GCGATTAAAA 


TGATAATTAA 


CGAATTAAAG 


TCATGTAAGT 


I860 


TGAAATTTTC 


TAAGCAAGCG 


CTCACATTTG 


TACCCATTAT 


TGTAACCATA 


TTGTTTATAT 


1920 


TATTTATAAA 


TTGGTATTTA 


AACGTAAATT 


TATGGAATGG 


TCGACAAATm AGTTTGTTTA 


1980 


CAGCGAGTTT 


TAATGCAATT 


ACATCGCTAT 


TAATTTCTAT 


AAACGTCTAT 


CAAGTTATCA 


2040 


ATTTTGAAGA 


AAATATTGGT 


CACTTTAATC 


ATATTTTAGG 


AAAAGCTAAT 


AGGCTAAATT 


2100 


GGTTAAATGC 


ATCAATGATT 


TTTACTTATA 


CTATTACAGC 


CATATGTATT 


CTATTAGCAT 


2160 


CAATTAATTT 


ATTGTGGCAT 


TCACATGATA 


TGAAAATAAC 


ACTTATGTTT 


ATAGGcGTaT 


2220 


CATTGTTTTT 


CAATGTaATT 


ATATTACTGC 


TACTTTTTAT 


TTTTAGTATT 


TTCATTAAAG 


2280 


ATGTAATGGC 


TATTGTTGTC 


GGAGTTTTAA 


TGTTTATTTT 


TAACGTTTAT 


TTTGGATTAG 


2340 


AAGTGCTTGG 


AGATCATTCG 


TGGTTCTATT 


TACCAATCAC 


ATATGCTACA 


CGTTACGTTT 


2400 


ATATGTTTAn 


CGAAGGGGAG 


TATACCAGTT 


ACATTAACAT 


TGGGCAATCT 


ATATnATTAT 


2460 


CACGnTGCCG 


AT 










2472 



(2) INFORMATION FOR SEQ ID NO: 643: 

35 ■ k U) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 646 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS i double 

(D) TOPOLOGY: linear 

40 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 643: 
ATAATATAGG AATTATTTCG ATnACAGATT TTACGAATCG TGCTACGATG CAAAATGAAn 60 

45 

ATAAAGATCC ATATGGCGAA AAGTTAGCTT ATGGAATTGC TTTTAATGGC AGTGTGGATA 120 
TGCAAGGGGA TAAACAAGTC ACAATTCCAA AATATAGTGT AGTTACAATT ACTGGCGAAA 180 
$Q ATAGTAAAAA TTATCGTGTT ACCGCCGATA ATAAGACTTA CTATGTTAGT AAAGATAAAT 240 
TAGAATATTT TAACCCGGCA GGTTTATATC AAACGCATAG TTTTAAAAAA TTAGCACCAT 300 
ATATGAAATC AAATTATAGT AATTACTATG CATACTTTAA TAGTCAATTA CATAAAAAGC 360 
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CACAACAACC GATACAATTA CTTTTCAATG ATAATAATCA GTTATACGGT TTTGTTTATC 480 

CAATTGTAGA TAAAAAAGAA TTAAAAGATA AGTTTAATAT TAACAATAAC ATTTGGATTA 540 

CTAAAGTTGG GAATGGATAT TGTATTGCCA ATTTGAAAGA AGACAAATGG ATTTATATTG 600 

AATTGTAGGT GTAAAGATGC TAGATAATAT TATTTTATAT TTTAAA 646 
(2) INFORMATION FOR SEQ ID NO: 644; 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 426 base pairs 
v (B) TYPE : nucleic acid 

(C) STRANDEDNESS : double 
15 (D) TOPOLOGY: linear 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 644: 

20 TAATATCGGA ATTTGATAAT GAAGATATCT AATTTTTTAA TATTCGTAGC TTTTATTTTT 60 

CTACTTATTT TATGTTTATT TTTAATCTTA CAAATGACAA ACCATTAAAA GTAGCATCCC 120 

AACATCAAAC AAAAAAACAA TTCATCAAAT AAAAATCGCT ACAAAACCAA GTCATTAAAC 180 

ACGCAATAAT TAAAATTTTC CACTCATTAT AATTCTGAAT TCCAAATGTC GAATTCCGAA 240 

AACCAAACTC CAAATTCCAA AAACGCAACT CCAAAATTAA AAGCATTTCC CTACCATTCG 300 

GGAAATGCTT TTTACATACT GgATTACTCT GTCATTAATG ATTTTACAAC GGgAAACCAT 360 

GTCGtCATGT ATGACCaAAG TAGCGTCGCT AtCaTaAgGt GGTTCGGATC TTTATTGGAT 420 

AATnAT 426 
3S (2) INFORMATION FOR SEQ ID NO: 645: 



<i> SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3241 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
40 (D) TOPOLOGY: linear 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 645: 

nTTATTTACC CACAACATGT TGCGACATTA GGTAAATGGG TACCTTATTT ACTTGGTATT 60 

GTTATGTTAG GTATGGGATT AACAATTACA CCTAATGATT TCAAAATGGT CTTTAAAGCA 120 

CCTAGAGCAG TAATTATTGG TGTCTGTCTA CAATTCAGTA TTATGCCCAC ATTAGCATTT 180 

ATAATTGCAA AGTCTTTTCA TTTACCACCT GATATTGCTG TTGGCGTAAT ATTAGTTGGA 240 

TGTTGTCCGG GTGGGACATC AAGTAATGTA ATGAGTTATT TAGCCAAAGC TAACGTAGCA 300 
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ATATATCTAT TTGCAAATGA ATGGTTGGAA GTATCTTTCG TGAGTATGTT GTGGTCAGTT 420 

GTTCAAGTTG TATTAATTCC AATTGCTTTA GGTATTGTTT TGCAAATTAT TAATCGTAAA 480 

ATTGCTGAAA AAGCTTCTAC AGCTTTGCCA ATTATATCAG TTGTTGCTAT TTCATTAATT 540 

TTAGCAATAG TTGTAGGTGG CAGTAAGCAC CAAATCTTAA CTACAGGATT ATTAATATTT 600 

TTAGTAGTTA TTTTACATAA CGTATTAGGG TATACGATTG GATATTGGTT AGCTCGTCTT 660 

TTAAAATTAG ATCGACAAGA TCAAAAAGCA GTCAGTATTG AAGTTGGAAT GCAGAACTCT 720 

GGTTTAGCTG TGTCATTAGC aGCATTGCAT TTTAATCCAA TTGCAGCAGT ACCAGGCGCA 780 

GTGTTTAGTT TCATTCATAA TATAACAGGG CCTATTTTAG CAAAGTATTG GTCAAAAAAG 840 

TTATAATTGC ACTAATAGAA TGAAGTGGTC ATCGGACTAT GTTAAGCTTT GATAAAGAGA 900 

AAAAATAGAG GAGTAAATAT ATGTATAGAG CAGTTATATT TGATTTCGAT GGAACAATAA 960 

20 TAGATACGGA ACAACATTTA TTTAATGTTA TTAATAAACA TTTAGAGATG CATAATGCCG 1020 

ATCCTATAAG CATTG ATTTT TATCGTTCTT CTATTGGAGG AGCAGCTACA GATTTGCATG 1080 

ACCATTTAAT TAAAGCGATT GGTTCGGAAA ATAAAGATAA ACTTTATGAA GAACATCATC 114 0 
TTACTAGTAC AACATTACCG ATGATTGATA CGATTAnATC ATTGATGGCA TTTTTAAAGC . 1200 

AACGTCACAT TCCTATGGCA ATTGCCACAA GTAGTGTGAA AGCGGAAATA ATGCCCACCT 1260 

TTAAAGCATT AGGTCTAGAC GATTATATAG AGGTAGTTGT TGGTAGAGAm GATGTTGAAC 1320 

AAGTTAAACC TGACCCTGAA TTATATTTAT CTGCAGTACA ACAATTAAAT TATATGCCGA 1380 

CACAATGTTT GGCTATTGAA GATTCTGTAA ATGGTGCAAC AGCCGCGATT GCAGCTGGAT 1440 

TAGATGTTAT TGTTAATACG AATAAAATGA CAAGCGCACA GGACTTTTCT AATGTAGATT 1500 

ATGTAGCAAA AGATATTGAT TACGATCAAA TTGTAGCGCG TTTCTTTACG AAATAGGAGG 1560 

CGTATCATGA TGGGTTACAT TATATTGTTT TTTCTAGCTG GTCCAGTAAT TTTAGGCGTT 1620 

40 GGAAATTTGG TGATTGGTCC TATATTTAAC AAACAGACAC CATTTCGCGT GCAAGTAAGA 1680 

TCTTTTGTTG kTGGkTCmAT GrTTTACTTA ATACTCGCAA CAATTGGCTA TTTTTTACTA 1740 

TTACAAGGTA AACTTTAACG AGAAAACCAC CTTACCTCAT TAAATGGACG ACCATATGTA 1800 

TGTGAAATGG TAGAACGTTC ATGTTTATGT ATGAGATAGG GTGGTTTAAA TAGTTACATA 1860 

TATTTTAATA ATAACGTCAC GATGATAAGT ACAATTAAGA TAATATCTAT GCCTACCATA 1920 

ATTGTAGCTC TTGTTGCA1T ACTTCCTTGT TCTTTTGCTG ATTTCATAGC ACGGTAGTTT 1980 

GGCACAAAGC TAATAATTAG TAAGATTAAT ACAATTACAC CAATTAATGC TGTTGTCATG 2040 

ATGAACGACC TCCTTTATTT TTTTCAATCA ATTCCCAAAT AAACGTAGCA ATCACACCGA 2100 
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CAATAATTAA TGCAATCGGT AAAGTCGTAC CGAGTTTAAT CTTGCGCTCT GGAGAATTAA 2220 

TAATAGTAAA TACTGTAAGA CAAATGAGTA TGAAAGCAAG TGTTGCAATA ATAGTTCTTC 2280 

CAACTAAATA TAGGATGTCA GGTTTTTCCA TACCGATATA ATTTATGATG AAAAATGCTA 234 0 

CAGCAAAGAG TACCGATATT TTTGTAGCAC GTAGCAGTAT TTGTTTTAAC ATTGATATAC 2400 

TCCTTTTTAA TATTATTAAA ATTATATCAT AATTACCAAG AATAGCTGAA GTTGTATGTG 2460 

ACTCAACGGT ACTTGAGCAA CTTTTTTAAT TTTTTAGAAA AATCACAAAA TAATTGTTTG 2520 

CAAAGTTGCA AAAGCCTGCT ATAGTAGTTC TGTAAACGAT TGCATGGTAT GCAAATATTA 2580 

ATGTACCAAA ATCGATAATT TATAGTATAA TTACGGCAAT AAGTTTTTTT ATGGATTTAT 2640 

TTAGTATCAA TCAGAGATGG GGTAAGAAGT TATGGAGAAC AATGAACTAC AAAGGGGATT 2700 

GAGTGCCCGT CAAATTCAAA TGATTGCACT TGGTGGTACG ATTGGCGTGG GGCTTTTCAT 2760 

GGGTGCGACA AGTACAATTA AATGGACAGG CCCATCAGTT ATCCTTGCAT ATTTAATTGC 2820 

GGGTATCTTT TTATTTTTAA TCATGAGAGC AATGGGGGAA ATGATTTATT TAAACCCTAC 2880 

AACAGGATCA TTTGCAACAT TTGCAAGTGA TTATATACAT CCTGCAGCAG GTTATATGAC 2940 

2S AGCATGGAGT AATATATTCC AATGGATTGT AGTTGGTATG AGTGAGGTCA TCGCAGTAGG 3 000 

AGAATATATG AAGTTTTGGT TCCCGGAATT GCCAACTTGG ATTCCTGGTG TTATTGCTAT 3060 

TTTATTATTA ATGGCAGCGA ATTTATTCTC GGTAAAAGCG TTTGGAGAAT TTGAATTTTG 3120 

30 GTTTGCTTTA ATTAAAGTTG TAACAATTAT TTTAATGATT ATTGCTGGTT TTGGTCTTAT 3180 

nnTCTnTGGT TTTGGAAATG GTGGCCATGC GGTAGGTATT TCTAATCTAT GGACAAATGG 3240 

C 3241 
(2) INFORMATION FOR SEQ ID NO: 646: 



10 



15 



20 



35 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1311 base pairs 
<B) TYPE: nucleic acid 
40 (C) STRANDEDNESS : double 

(DJ TOPOLOGY: linear 



45 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 646: 

AGGCGTCAAC TCAGATGGTT TAATAATTGC CGTATTACCT GCTGCAATAG CACCGATTAA 60 

AGGTtCGAaC ACTAGTtGAA AAGGATAGTT AAATGGTGCA ATGATCAAAA CTGTTCCATA 120 

50 AGGTTCTTTT TTGATATAGC TTTTTGTTGG AAATAAATAT AAAGGTGTGT CTACATTkTT 180 

TGTTTTAGTC CAGTTTTTAA GTTC cTTACG GGCAATTTTG ATACTTyTCA AAGTTATGCC 240 
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AATATCGCTC 


TCGTATGATT 


TAATAGCTTT 


GCTTAACTTC 


TTTAATTGCT 


CTTTTCTAAA 


360 




ACTAATATCT 


TTAGTTTGTT 


GTGTATTGAA 


AAAAGCTTTA 


CTGTCATAAA 


ATTTTTGCTC 


420 


5 


AATGATATTC 


ATAATGAAAA 


GAACCTCCTT 


ATATGATTAT 


TTTGGAAAAA 


GCGATTAATT 


480 




GATTTGAATG 


TTGTGGC'CGT 


TAATTTTAAA 


TGGTCTTTCG 


AATTATATAT 


GTTGAAAGTT 


540 




GAAAATAGAQ 


CGATGAATCG 


TGTACATAAT 


AATATTTATA 


ACTTTAATCA 


TAACGAAAAA 


600 


10 


GGTAGGAAGA 


AAACAAAAAT 


TTATACTCAA 


CATCGCAAAT 


ATTTTAAGAA 


AATGTAAAGA 


660 




CAAAAGGGGA 


ATTGTATAGA 


AATCACTAAT 


CTGTGGGTTA 


GGGTAGCTAA 


AGGAATAAAA 


720 


IS 


ACTACTATTG 


AAAAAGGGTT 


GTAAATTAGT 


CAAACGTAAA 


TAAAAAACAG 


TTCATTGAAA 


780 


GTGAAATAAA 


TTCTACTTTA 


ATGAACTGTT 


AGTTAAATAC 


AACATGTCTA 


TAATTAGACA 


840 




GTAATATAGT 


ATTATTTTGT 


TAATGCTTCA 


GTGATTTGAG 


GTACGATTTG 


TTTTTTTCGA 


900 


20 


GAAACGACAC 


CAGATAAGAA 


GGCCATGTCA 


TCTTCTAATT 


GAACATTGAA 


TGtTCGCCAA 


960 




CTTTATCTTT 


TTCAGCACCT 


ACAACTAAAA 


TTTTAGAATC 


ACTATTAATG 


ATGTCAGTAA 


1020 




CAACAAGTAC 


AAATAAGTCA 


TATTTTTCTT 


GTGCACTTAC 


AGCTAACATT 


TCTTTTTCTA 


1080 


25 


rATCTTCTTT 


ACGATTTAAC 


ACTTCGTCAA 


GGTCAACAGC 


ATTAACTTGT 


GCAATACGAG 


1140 




TCACATAGTC 


ACCCATAGTA 


AATGATTTAG 


CATCCATGTT 


TAATAAGAAT 


TCAACTGATT 


1200 




TATCAGTTGT 


TGAAGCACCT 


GCTTTtAACA 


TATCTAAGCC 


GTACTTTTGA 


ATATCAACTT 


1260 


30 


TAGCAATATC 


TTTnAATTCT 


tCAGCTGCTT 


TAACATCTTG 


TTGTGTACAT 


G 


1311 



(2) INFORMATION FOR SEQ ID NO: 647: 

(i) SEQUENCE CHARACTERISTICS: 
35 (A) LENGTH: 14 98 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

40 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 647: 
CATATACTTT TTCATTTCTT TACGAGATAC 
45 ATCCATATGT GCTTGCGTTT CAGaATGTCC 
TTTACCAAAC AACGTTAATT TCTTTTTACA 

TACATTCTTT TTCGTCTTAC AAG ATGGATC 

so 

TTTAACTTTA ATCATGAATT TACCACACGT 

TTTATATTTA CGATCACTAT TTTTAATCCC 



TTTACCAGAG GATTTAGACT 
ACAAACACAA CGATATACCG 
GTTTGGACAT CTTGCATTTG 
TTGGCACACA AGCATCTGAC 
TGGGCATTCT GTGGTTGTTA 
ATTTACAACA TCTTTCGTAA 



TCATACGCTG 60 

CTTCTTTCCC 120 

TTTTGCGCTG 180 

CATTTTTAGT 240 

AATTATCGTG 300 

AATCTTTCAT 360 
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CCATTGTGcA GTTAAAAGTG GCGACGTTAA TTCTTCTGGT GCTAATTCTA ATATTTGTTT 480 

ACCTTTTGAC GTTACTTTAA TTTTACCGTC TCTTGATTCA ATGGCATTCA TATTAAATAA 540 

TTTATCGATA ATGTCGGCCC TTGTTGCAAC TGTGCCGATA CCACCTGTTT GTTTTAAAGT 600 

TTGCGCATAT TTTTTATCCT TCAATTGAAT AAAGTTCTGA GGGTTCTCCA TCGCTTTTAA 660 

TAACGAACCT TCATTAAAAT ATTCTGGAGG TGTTGTTTCA TGTTCTCTAA TATTTGTTTT 720 

TGAAATCTTC ACTTCATCGC CTTCTGAAAA AGGCTGTTGC ATCTCTGTAA TAGATTCACC 780 

TTGTCTAATA GATTTAAAAC CTAAAACAGT TGTTACATTC TCTTTCAAAA CAAATGTGTG 840 

1S CCCTGCAACC TCTAAAGTTA CAGTTATCGC GTCATACTCG TGCGGAGGCA TTAAAGCTTC 900 

TAAAAAACGC TCGACAATCA TATCGTATAA CTTTAATTCT CTATTACTTA AGTCTGACAT 960 

GACAGGTCTC ACTTCTGTAG GAATAATTGC ATGGTGATCA GATACTTTTT GATTATTAAA 1020 

20 TATCGACATT TTTGATGAAA ATGTTTTAGA CATTAATGGG CGTGCTTGGT CTTTATATGT 1080 

TGTTGCCATC GTCACCTGAA TACGTTCTTT CATAGTATCT ACCATATCAG TTGTTAAATA 1140 

GTTTGAATCT GTTCTTGGAT AGGTTACGAC TTTATGTCTC TCATATAAGC TTTGAAGTGT 1200 

ATTCAATGTT TCTTTAGGTC CAATTTTATA ACGTCTATAC ATATCTTGTT GTAAATCTGT 1260 

TAAATTGTAC AGTGATTGCG GATACGACTT CTTATGTTTA GTAGCAACAG ATTTAATCTT 1320 

ACCATCGACA TTTTTCAAAT TATTAACCAT CTGTTCTAAA GTTTCTTTAw TGGtATATCG 1380 

CTGATTTGaw TCTAGCTGAA AATCAAACCC TTTTACCGTT AATGATAATG TAAAGTATTG 1440 

TTGTGGnTTG AACTGATTAA TCTCTTGTTG GTCGTGTAAT TTACTAAATT GAAACGGn 1498 
35 (2) INFORMATION FOR SEQ ID NO: 648: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1044 base pairs 

(B) TYPE: nucleic acid 
40 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

4s (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 648: 

TAAAACAATT CGTTTTATTA ATACAGTTTG TAAAAGTATT CTCTTAGTAC TAATAGCTAA 60 

TGTAATGATA GAAAATACTA GTGTTATTAA AGATTTGAAT AAAATAAAAG AAACTGAGAA 120 

50 ATATTGGAAT GTATTAGATG ATTATTACAC GATTGAATTT GCACCTTATC ACGAAACAAA 180 

ACAAAGTTTG ATTGATAATA TGGTGCGATC AGAACAATTA GTAAAGGCTA GTGAAGCAGA 240 

AAATAATGCG ATTTTATTCA AACCAAAGGG TGACTCCGTT GACAATGACA ACTTTTCGCC 3 00 
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TCAACCTGAT 


ATTCCGATAA 


AAAATCAAAA 


AAATAATGTC 


GAAGTAATTA 


TTCCACAAAA 


GTTTCATGCA 

^3 AAA Wl A YJS-«*» 


ATGCGTAATG 


A A AT C A A TP A 


AGCATATCAT TCATGGTTTG AATTTGTACA 


AAATAAAAAT 

A /Winn a 


AATAAAGAGA 


ATAAGTTATP 


TATACAGTTT 


ATCAACAAAA 


ATGATTGTCG 


AAT/TTTTTCA 

• m A A A A A A 


TTTGATGCAC 


GAGATAGTCG 


CCATTTGTCA 


TTTATAGAGG 


CGCCAATCAT 


TGTGAATGTT 


CAGGCATrAG 


*\ X X lnl Uuon 


TGATTTttAT 


TATGCCATGa 


TCaGTCaAGG 


f*Grtf5*PAT v TT.a 
^vjsauini a xa 


TTGaAAAATT 


n X OCI LULuU X 


AGTAAAAAAT 


ATTGGAAAAG 


TATCCATCTT 


gatggggaaa 


X tt-w/Yo XVnarvri 




TAAAGATAGC 


gtgatggaaa 


TGTATCATGA 


AAACAATTTG 


AAATTAACAG 


TACTCAACTT 


TTCACAAATC 


ATTATCGCAA 


TCATTTTAAT 


AATTATTATT 


TTATTTGATG 


TGAAATATTA 


TTTTGAACAG 


CATCGAAAAT 


TACTCGTAAT 


CAAAAAGCTA 


TATGGTTATT 


CAACATTAAG 


AGCCAATTAC 


CAATACTTAT 


TAATAAATAA 


TATAGTTGTT 


ATTTTTATTG 


GAATATTGAC 


GAATGTAATT 


TTACATTCTC 


ACTATATAAT 


GATGTTATTT 


GCAACGATTC 


TTGT 









(2) INFORMATION FOR SEQ ID NO: 649: 

(i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 399 base pairs 
<B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 64 9: 
GAACATATTG GGTTATGCAA GGnGGTCACT CTTCACACTT ATAAACAACA TTTTAATAAT 
GTAAAGTTTA ACCAGCTAAC ACTTTTGTTA GCTGGTTTTT ATTTTCCTTC AATTTTTAAA 
TGGTTAAGTC CCCTTCTATA TCTTATAAGA CAATCATTAT AATCAATTCA ATTAATACAT 
TAACAACCAC AACTAATAAA TATAGTAACT TCAAAATCCA TATTTATGTC TAAAGATAAT 
CTCAATGTTG TTCACGTCAA TAAAATTATC CCTAGGTTTT TAAAAATTGT ACATGTTTAA 
ACAATCAAAA GTGTACATTA TTAAATTATC ATTTCCAGTT AGATTTAGAA AACATTCACA 
CCACGCATGG ACCAACGTAT TCGTCTTcAT TcATTTTAG 
(2) INFORMATION FOR SEQ ID NO: 650: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 747 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 650: 

GTACTAGGTT CTAnGATTCC CTACTGTAGT CATAGATATT TTCCAAACAG AGCCTGACAA 60 

CTTTTCATTT TTAATAGTGA TCACTATATT AATCGCTATT GCAATTTATG CATGTCGATT 120 

TGTTTGGGTT TATTTCTGGT ACAAAGATTT TTATTTCCCG AAAAATATAC AATCTTATCT 180 

AGACGAGGAA CATGATTCAC ATGAAACACC ACCTTCTCGA GTGCGTTACG CATTTATTAT 240 

GACCATGTGT GGTATTCACG GTACAATTTC ACTTTCAATG GCACTTACAT TACCATTTAT 300 

CATTACAAAA GGACAAGCAT TCGAATACCG TAATGATTTA TTGTTTATTG CATCTTTCAT 360 

GGTATTAATT AGTTTAATCT TAGCGCAAAT TGTTTTACCT TTAATTACAC CATCTGCCGA 420 

AGATACTACT TTTAAAGGTA TGACTTATCA ATCTGCCAAA ATTTTCATTG TTCAAAAAGT 4 80 

GATCCAGCAT TTTAAAAACG AAAGTAAAAA AGACAAAAAC GATACAAATT ATCGCCCAGT 540 

20 ATTAAACCAA TACTATGGAG AATTGTTATT TTTATTAAAT TCAGAACCTG ATAATCAAAA 600 

TACrAAAGAa CTCAAACGTT TAGAAGATAT TGCaAAAGTA ATCGAAACAT CTACACTTGA 660 

GCGTTTAATT GATAAAGGTA AGGCAACATA TCAGGATATT AATAATTACC GCAATATTGT 720 

25 CGAATTAACA GAGACACACC GTACTGC 747 

(2) INFORMATION FOR SEQ ID NO: 651: 

(l) SEQUENCE CHARACTERISTICS: 
30 <A) LENGTH: 1373 base pairs 

<B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

35 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 651: 
ATACAATACT CTTTTATTAT TCAATAAGCC ACTTCCTATA GCAAATGTTT AACTTTAAAT 60 

40 ATTTTTCGAT GCTAACAAAA AATCACACTA TCATCTTTTA AAATGAAAGT GTGATTACAA 120 

GCAAATCTGT AAAATTTATA AAGCAGAAAC AATTCAACTT TATCATTATG ACATTTCAAT 180 

TAAACCTTCT ACATTATAGT TCCAAGCATC TTACACATGA ATGCAAGTAT TTAACGATTT 240 

AATTGTGACA TAGCCTGTTG ATATTGTGTT TCATTGATAT AATTTTGTTG CTTCATTTTT 300 

TCTAAGTTCG TGCTTACACG TTGCGTAAAA TTCTCTGACA TATTATTGAT ATTATATACG 360 

CTAGGTGCAT TGACTTTACT AGCTAAAATA GCGCTTTGTA AAACTGTTAT GTGAGACATT 420 

GTTGTACTAT TTTTATTCAC GGTTGTTCCA AAGTAATGGT TTGCTGCGCC CTCAAGCGTA 480 

TATTGATTAT CCCCAAAGTA AATATTATTT AAATAAAAGC TTAAAATTTC GTTCTTATTA 540 
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TCATTATCAT AAAAATAATT TTTGACAACT TGTTGTGTAA TGGTACTACC ACCTTGCACA 660 

TCTCTGTCGC TAATCGTTGA AAATAAAGCT CTAGTTGTAC CTTTCAAATC GAATCCATGA 720 

TGATTGTAGA ATCGTTCATC TTCCATTGAA ATAAAGGCAC CTTTAACATA CTCTGGCATG 780 

TTATCAGCTG ACACAAAACT ACTTTTATTT TCAATTTTTC TTAGTTCATC CACATTATCG 840 

CGTGTAGATA AAAAATACAT GATACCAATA AACAATGCGA TAATGATTAG AATGGTTAAT 900 

AATATTTTTA ATAGTATTCG TTTACTTTTT TTCTTTTTCG GCGGTTTGCC AACTGGTTGA 960 

TAATACGTAT TATAGTGAGG TTCGTGTTTC ATATGCTCAA AATGTTCATT TGAGTTTGAG 1020 

TACCTATCGC TTCTTTTCAT GCGTTTGCTC CTTCTTTTAA AACTCACTTA GtATATACCT 1080 

TGaGTTTACC AGTACTATCA CAAATAGGCT ACACTTTTTG GGAAAATCAG TCCAAGGGCT 1140 

TACAATCGTA TACGCCATCA TACTTACTTT TTTGTTTTTT GAAAAAATTA TAGATAAATC 1200 

20 ATTGCAATTT TAAATATTAA TCATGTCAAA TATTGTTATA TTTTATAAAA ATAAAAGACC 1260 

ATCCCTATTA AATGCCAATA GAGACGACCT TTTATTTGTT ATTCATTTAT TAAAACTAAA 1320 

ATCCATATTT CATTTCAAAC GAAAATATAT AAATTTTAAC AATCGrTAAC CAC 1373 
(2) INFORMATION FOR SEQ ID NO: 652: 



10 



15 



25 



(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 859 base pairs 

(B) TYPE: nucleic acid 
30 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



35 Ui) SEQUENCE DESCRIPTION: SEQ ID NO: 652: 

GGCAGATAAT TTAGTCATTG TTGAATCGCC TGCAAAAGCA AnAACCATTG AAAAGTATTT 60 

AGGTAAGAAA TATAAAGTTA TAGCTTCAAT GGGACACGTC AGAGACTTAC CAAGAAGTCA 120 

AATGGGTGTC GACACTGAAG ATAATTACGA ACCAAAATAT ATAACAATAC GCGGAAAAGG 180 

TCCTGTTGTA AAAGAATTGA AAAAACATGC AAAAAAAGCG AAAAACGTCT TTCTCGCAAG 240 

TGACCCCGAC CGTGAAGGTG AAGCAATTGC TTGGCATTTA TCAAAAATTT TAGAGCTTGA 300 

AGATTCTAAA GAAAATCGCG TTGTTTTCAA CGAAATAACT AAAGACGCTG TTAAAGAAAG 360 

TTTTAAAAAT CCTAGAGAAA TTGAAATGAA CTTAGTCGAT GCACAACAAG CGCGTCGAAT 420 

ATTAGATAGA TTAGTTGGCT ATAACATCTC GCCAGTTCTT TGGAAAAAAG TAAAAAAAGG 4 80 
GTTGTCAGCG GGTCGAGTTC AATCTGTTaG CmTTCGTTTA GTCATTGACC GTGAAAATGA ' 540 

nATTCGAAAC TTTAAACCAG AnGAATATTG GACTATTGAA GG AG AATTTA GATACAAAAA 600 
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aAAAGATGTT GAGAAAATTA CAGCTGCATT AGATGGAGAT CAATTCGAAA TTACAAACGT 720 
GACTAAAAAA GAAAAAACGC GTAATCGAGC AAACCCATTT ACAACTTCTA CATTACAACA 780 
5 AGAGGCGGCA CGTAAATTAA AcTTTmAAGC AAGAAAAACA ATGATGGTCG CACAACAATT 840 

ATATGAAGGT ATAGATTTG 859 
(2) INFORMATION FOR SEQ ID NO: 653: 

10 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 747 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 653: 



20 


TTCAACTTCG 


TTTGGAAATC 


ATGTTCCTCA 


ATTGTTGGAC 


TTAAACGAAT 


TTCTTTAACA 


60 




TTGATAATTT 


TTTGTTTCTT 


TTTCATTTCT 


TTTTCTTTTT 


TCTGTTGTTC 


GAATTTGAAT 


120 




TTACCGTAAT 


CCATAATTCT 


TGCAACTGGT 


GGTTTCGCAT 


TCGGTGCAAC 


GACCACTAAG 


180 


25 


TCTAAATCTA 


CACGTTCAGC 


CATTTCTAAA 


GCTTCACGCT 


TTGATTTAAC 


ACCAATTTGT 


240 




TCACCATCTT 


GACCGATTAA 


ACGTAATTCT 


TTTGCACGAA 


TTTTGTCATT 


GATTTGAGTT 


300 


30 


TGATCTTTTG 


CTATGGTTGA 


CACCTCCAAA 


ATTTTTACGA 


AATTTGCACC 


AAGCAAAAAG 


360 




GAAGAGCAGG 


TATAAAATAC 


CCGCTCTTCC 


TTATACACAG 


TTATGTGTAA 


TGTGATTAAC 


420 




CTGCCAACTG 


CTTTATGCGT 


CGCTACAGGT 


GAGAAGCGGG 


. TGCTTCTACT 


TGGTTCGTTT 


480 


35 


CGTATTCAAC 


GTTATTAATC 


ATATCAACAA 


TTCACATTTA 


AGTCAACACT 


ATAACTGTAA 


540 




TTATTTTTAT 


TTTAACCTTT 


TATTTCATCC 


ATTGACACGT 


CTTGACGTAA 


ATCTACTTGT 


600 




TCTAATGGAA 


TTTTTTTCGT 


TTTATATCGA 


AGCTTATGAT AAATAAAGAA 


TGCTAAAAAT 


660 


40 


ACTGGAATTC 
AAGTCAACAT 


CCATATACGT 
CTTGCCCAAn 


AATTAAGAAG 
AAnTACT 


CGACTAAAAT 


TAAAATCTCC 


TGTnTTAATA 


720 
747 



(2) INFORMATION FOR SEQ ID NO: 654: 

45 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 501 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
„ (Di TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 654: 
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TTGTGCTTCT TTTTTAGCTT CTTGAACCTC TTGTGCCTCT TGTGATGTAT CACTyAAATT 
ATTTGCACTT GCTTCTTCTT TTATCGCTGC TTGTTGTGCT TTCAATGCCA CTGCTTTTGr 
TTCTTyATTT GATACAGCCA CACTTTTATC CGCTTCTGCT TGTGCTTCTC TTTTAGCTTC 
TTGAATCTCT TGTGCTTCTT GTGATGTATC ACTTAAATTA TTTGCACTTG CVrcnTCTTT 
TATCGCTGCT TGTTGTGCCT TTAATGCCGC TTGCTCATTT TTAGATTTGT TTAAAAATCC 
TTCAACACGT TCTTTTGTAT AGGCAACCGT TTCTTCAAGT TGCGTTTTTC T 1TC TTCAAA 
CTTTTGCGAC AGTTCTTGTn CTTTGACTTT nAAATCATCT GCTTTTTGAT AAACTTTATT 
TTAAAATACC AACCTAAAGC C 
(2) INFORMATION FOR SEQ ID NO: 655: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 830 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS: double 
(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 655: 



CACCTTGTCA 


TAATTAATTT 


TTTGATTTTT 


CATTTTACTG 


ATAATAGGTT 


CAGCATTAAT 


CATGATTTAA 


CCTCCCACAT 


TTAATCATTA 


ACTTCTATTA 


TATATGATTC 


ATATTAAATG 


TCAGTCAAAA 


AAGTTAGAAA 


TTCATTTTAA 


TGCATTTATA 


TTTCGAAAAT 


CCCTTATGTA 


TCTAAAAGCA 


TTTTTTAAAC 1 TTGAATTTTA 


AAACACTAAA 


CAACACATAC 


GTCTCTGTGT 


CATTTTCATT 


TTTTGTATGT 


CATATATATG 


TTTACTTCAT 


TTAAATCAAT 


TTCATCTTAT 


AATTTATCGT 


GTATTTTACA AAAGATTGAC 


TTCAATTCAT 


CGTAAAAGTT 


ATACTTTTGC 


CATTTTTTAA 


TGTAACATGG 


TGTTAGTAAT 


AAAAATAATA 


CATTGAGGTG 


TTTTACATGA 


CAGCATTATT 


CCCTTATATC 


GCTTTTGAAA 


ATTCAAAAGA 


AGCCCTTGCA 


TATTACGAAG 


AAGTATTTGG 


TGCAACTGAC 


GTTAAACGTT 


TAGAAGTTGG 


CGAAGAACAA 


GCGTCACATT 


TTGGTATGAC 


TAAGGAAGAA 


GCGCAAGAAG 


CAACTATGCA 


TGCTGAATTT 


GAAGTGCTTG 


GCGTAAAAGT 


GTTATGTTCT 


GATTCTTTTG 


GTCGCGCTGA 


CAAAATTaAT 


AATGGCATAT 


CATTATTAAT 


TGATTATGAT 


GTTAACAATA 


AGGAAGATGC 


TGATAAAGTT 


GAAGCATTCT 


ATGAGCAAAT 


TAAAGATCAT 


TCTTCAATTG 


AAATAGAATT 


ACCGTTTGCT 


GACCAATTCT 


GGGGTGGCAA 


AATGGGCGTC 


TTTACCGATA 


AATACGGTGT 


TCGTTGGATG 





(2) INFORMATION FOR SEQ ID NO; 656: 
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(A) LENGTH: 539 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

5 



Ui) SEQUENCE DESCRIPTION: SEQ ID NO: 656:. 



10 


GTATCCATGG 


GCCCGTTnCG 


CACAACATTT 


GGnACAATTA 


GGTACACGnG 


TTGTCaTCGG 


60 




TCGTTTCGGT 


ATAATTTTAT 


CGAATGaAGG 


CGGTGCGTTA 


CAAACAATGA 


AACTACCATA 


120 




CGAATATTAC 


ATTGGTGGTA 


AATTAGGTTC 


TGGTCAACAA 


TGGTATTCAT 


GGATTCATAT 


180 


15 


CAATGATTTA 


ATTCAAGCTA 


TTTTATTTTT 


AATAAATAAC 


GAGTCAGCTA 


GTGGTCCGTT 


240 




TAATTTAACT 


GCACCTATAC 


CTGAACGTCA 


AAATTTATTT 


GGCTACACTT 


TAGCAAGAGC 


300 




TATGCATAAG 


CCTCATGAAA 


CTTGGGCACC 


AAGTCTTGCA ATGCGTCTCA 


TACTTGGTCA 


360 


20 


AATGTCAACA 


GTAGTATTGG 


ATACTCAAAA 


AGTATTACCT 


aATAAAATTC 


AAGCATTGGG 


420 




aTTCCAATTT 


AAATATAGTA 


ATTTAAAAAT 


GGnACTTGAA GATTTAATTA 


AAGAATAATC 


480 




AATACCATTA 


ATGAGCATTA 


GAAACAACAT 


ATGTACTAAA 


TGTAATGTCT 


AGAGCGACT 


539 



25 

(2) INFORMATION FOR SEQ ID NO: 657: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1106 base pairs 
30 (B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



35 <xi) SEQUENCE DESCRIPTION: SEQ ID NO: 657: 

ATCAAGTTGA ATATCATCCA 
AACGTATCGT gATGGaATCT 

40 

CAATTAAAGA CATTGCTCAA 
ATGTGCAGCA TGCTGTGGTT 
ATTTCCAAAT ATTTGATTTC 

45 

ATCAAGATAA GAGAATTGGA 
AACTGATGAA AAGGTTAGAT 
SO AAAAAAGCTG ATTTCTATTA 
AATGTACAGC TCGTTGAGCT 
GCTCTCGTTT AACTTTATTT 

55 



TATTTAACCC AACATAAATT GArATTATAT TTGGCAGCAC 60 

TGGTCACCAT TGATGAATGC ACAAATTTTA AATGATGAGA 120 

GAATTAGGAA AGTCACCTGC CCAAGTTGTT TTAAGATGGA 180 

ACAATCCCTA AATCGGTGAC ACCAAACAGA ATCTCTGAAA 240 

GAATTATCAG ATGAACAAAT GACGCGAATT GATGGTTTAA 300 

CCTGATCCAA AAAAATTTGA AGGCTAGATT AAAATCGCTC 360 

GAATTGTCAG GGCTTGGGAC ATTAAGTTCT TAGGCAATGT 420 

ATTATTTGAT AGAAATCAGC TTTTTTGATA TGTATTTTAT 480 

GCTATTTTCC TTATATTAAG TGCCATTAAT ACAAAACCTA 540 

AtTCCTCGAA CTGACGTTCG AGTTAAACCC AAAATAGCCT 600 
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CTGGTTCAGA AAGCTTTTGA TTAATTTGGA CTTTAAAGTA TTCCCAATTA TAATTCTTCA 
TGATTtTCTT ATTGGATTTT GAATTTGGTT TCATGCATTG TTGCCTCAAA GAACATGCTG 
AACAGTCATC GCATTCATAT AGTTTGAAGT CTCGTTTAAA ACCATATCTA TCATTACGGT 
ATGCATATCT TTTAAAACCT ATTCTTTTGT TATTAGGACA TATAAATTCA TCATTAAGTT 
CGTCATATTT CCAATTTTGA GTGTCGAAAA TGTCACTTTT AAACTTTCTA GTTTTATCtT 
TAATAAACAT GCCATACGTA ATAAGTGGCG TTTTATTAAA ATCATCTATA ATGGCCATAT 
AGTTTTGGCT CACTACCCAT AACCTGGCAT CAGCTACCAA ATGAACCGAA GGGATTTTTG 
GAATCCATTG GTTGAAAAAA TGGGAA 
(2) INFORMATION FOR SEQ ID NO: 658: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 4 00 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

- (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 658: 
TTTTAACTTT ACTCTTTGAT TTAAAGAGTG ATAAATGTTT ACAGTTTAAT TAAAACTGCA 
TAAGAACTTC TAGCTTTTCT CTTTCGTTCA AAGAGAAGCA GCTGTTCGCA GTTTAATCAA 
AACCACATAA AGCTTTTAAC TTTACTCTTT GATTTAAAGA GTGATAAATG TTTACAGTTT 
AATTAAAACT GCATAAGAAC TTCTAGCTTT TCTCTTTCGT TCAAAGAGAA GCAGCTGTTC 
GCAGTTTAAT CAAAACCACA TAAAGCTTTT AACTTTACTC TTTGATTTAA AGAGTGACAA 
ATGTTTACAG TTTAATTAAA ACTGCATAAG AACTTCTAGC TTTTCTCTTT CGTTCAAAGA 
GAAGTTCTAA TACCACCATA TCGTGCGATC GGGAACGGTA 
(2) INFORMATION FOR SEQ ID NO: 659: 
(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1899 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 659: 
ATAATTACAA TGGCTACTGC AATTATTGTT GGAATTATAT ATTTCAGTTT AGTCATCATT 
TATGCTCCCT TGATTTCAAA TTCATATCAT TAGTTTACCA TATTGAAGAT GATATAATAA 
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AACTTTAACT GAGCTTCATG GGG CACCAGG 
TCAGCAAATG GCGCCGTACG TAGATGAATT 
5 TGTGAAAAAA TCTAAAAATC CAAATGCAAA 
AATCGGATTT ATGATTACAA ATATCACTAA 
TGGTGTTGCA AATGATATTT GGCAAGGACA 

10 

TAAAATTATC GGTGTTGTTT CTAATATACC 
ACCGGAAATT AAAGATTTAA CATTAGATAT 
gCGCGGAATA GATATAGGAG ATACAATTGT 
ACATCGATAT AGTGCTAAAG CATGGGATAA 
ACTAGAATTA TTAAAAGATA TAGAATTAGA 

20 AGAAGAGGTT GGATTACGAG GTGCGAAAGC 
ATTTGTAGTT GATTGTTCAC CTGCCAATGA 
ACTTGGTAAA GGGACGTTAA TTCGCATAAA 

25 TAGAGACTAT TTATTAAAGT TAGTAGAAGC 

ACCAGGTGGA ACAGATGGTG GAGAAATTCA 

TATTGGTGTA TGTGCACGAT ATATTCATAG 

30 

TTTTGCAGCT AGATCTTTAC TTTCAGAAGC 

AACATTACAA TATAAATAAT CGGGTAATAA 

TCATTAATTA AGGAGACATA AAAATGAAAC 

35 

TAAAACAAGG TGCTACAGTA TTTGAATTCA 
TAGAACCAGA TTTACCGGAA TTAGAAGCGA 

40 ACGGTGATAA ATTTATGGAT ATTTGTATTG 
TAGTATATAA AAATGGAGAA CTGCTTGGAA 
AACAGATAGA TGCATTTTTA GCTCAATACG 

45 TACTCGTTTT TCTCTGTTAC TATGTGTTGA 
TAGGAGTGTT ACATATGAAT ACCTTTCAAA 
ATTTAGACGT TGATTTTAAA TTTAATCGTG 

SO 

ATAATAACAA AGGTATCACG ATTAAACTTA 
AAGAAAAAAT TGTAGATGAA ATTGTTTATT 
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TTTTGAAGAA GAAGTAAAAA ATTATATGAC 240 

TATTGAAAAT CGTATGGGTG GATTTTTTGG 300 

ACGTGTAATG • ATTGCAGCAC ATATGGaTGA 360 

AAATGGAATG ATTCAATTCA CAAATTTAGG 420 

ACGCTTAGTA ATTAAAAATA GAAATGGCGA 480 

TAAACATTTT CGTACTGGTA GTGAAGGTGC 540 

AGGTGCTCAA AATGAAGATG AGGTGCGTGA 600 

ACCTCACACG CCATTCACAC AGTTATCTGA 660 

TCGTTATGGT TGTGTCTTGG CAATTGAAAT 720 

TGTAGACTTG TATGTTGGCG CAAATGTTCA 780 

ATCTGCAGAG ATGATAGACC CAGAGGTTGC 840 

CGTTAAAGGA AACCAACCAT TATCTGGTGA 900 

AGACGGTACA ATGATTTTAA AGCCTGTATT 960 

ACATGACATT GAACATCAAT ACTATATGTC 1020 

TAAAGCTAAT ATTGGTATTC CGACTGCAGT 1080 

TACAGACTCA GTATTTGATA TAAGAGACTA 1140 

CATTTGTAAT TTAGATAATA ATCAAATAGA 1200 

CAACTATTAT CTCTAAATAG TTATATATAA 1260 
AACTTGAATC AGAACAACAA TTTGAATCTT . 1320 

CTGCAGGCTG GTGTCCAGAT TGTAGAGTGA 1380 

GATATCCTAT GTTTGACTTC GTATCAGTAG 1440 

AAAATGGTAT TATGGGTATT CCAAGTTTTC 1500 

GTTATATTGG AAAAGAACGA AAATCAATTG 1560 

TGTAATTTAG ACTAGAGAAA AACGGGGTAA 1620 

TTTATTGTAA ACTATTATAA GGTGCGAAAT 1680 

TGAGAGATAA ATTAAAGGAA CGTTTAAGCC 1740 

AAGAAGAAAC TTTGCGTATT TATCGAACAG 1800 

ACGCTATAGT CGCAAAATAT GAAGATAAAA 1860 

ACGTTGATG 1899 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 3774 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 660: 

GTATAATATC CTTTCAATCT GTTTTCATAT TTTATATATT TTTTAAATAT AAGTGCTAAA 60 

TGTTTTAACT AAAGCATAGA TTGACAAGAT GTTATACAGA ATTTCAAATT CTATCCAATA 120 

TTGTTCGAAG TGTAGTATCA CTGGATTGGT ATTAAACAAT GTAAAGGAGA GATTGCAAAT 180 

GCCGTATAAT TACAAGAAAC AAAATGGAGA GTTAATGTCT GTAATGAGCC AAGGTGAAAA 240 

GTTTATTCAT CAATCACCCG TTAATGATGA ACTTAGTGCA TTGATTAAGT TATTAATTTC 300 

20 TAAAATTAAC GGTTGTCATT ATTGTGTTGA TATCCATAAA AAAGAATTAA AGGAATTGGG 360 

TGTAaCACAA ATGAAAATTG ATGAAGTCTT GAGTTTTAGA CATTTAGATT TATTTACTGA 420 

TCAAGAAAAA GTGACGCTTG AATTTGCAGA AATGTTAAAT TCAATCAAAG ACTTTAAGAA 480 

GTTTGAAATT ATTGACCGGC TAAAATCATT TTATGATGAA GAACAAATTA TTGATCTTGT 540 

CTTTGTTGTA AACCAAATTA ACGGTTGGAA CAGATTAAAT ATTATTAGTG ATAGACTATA 600 

ATTGTTCATA TAAATGCAGA GTTTCATCTC GAACGCTATA TCATAACAAA TCATGCCACT 660 

ATACAGGTCA AATCTTGTAT AGTGGCATTT TAATTTATCC CTTTGAATAC TGTTATTTAA 720 

CGAATATCGG TCCACCTGGT CCAACAGGGA TACCTAATAG GAACCAAATG ATGACAAATA 780 

CTGTCCATAC AATACTTAGC GCGATTGAAT ACGGCATTAA ACTAGAAAGT AAGGCTCCGA 840 

GTTTCATGCG TTTATCGTAT TTTTGTGCAT AAGTTAATAA TAAAGGTAAG TACGGCATCA 900 

TCGGTGTAAT TGGATTGGTA ATTGAATCGC CTACACGGTA AATGACTTGT GTGAATGCGG 960 

40 GATGAAAGCC GATAAGGATT AACATTGGTA CGAATATCGG TCCTAAAATA CCCCATTTAG 1020 

CCGATGCGCT TCCGATTAAC ATGTTGACCA TTGCACTCAG TACAATAATA CCTAGTATCA 1080 

ATACAATACC GTTTTGATGT TCTAATAATT TGGCACCTTT AACAGCAGCG ATAATTCCTA 1140 

AATTACTCCA CTTTAAATAC GCAAGTAGCT GTGCTGCAAA AAACACAATA ACGATAAATG 1200 

TTCCCATTGA TCCTACAGCA TCGCCGAACA TTTTACCTAA GTCTTTTGTA TTTTTAATTT 1260 

CTTTGCTTAA AATCCCATAA ACTAATCCAG GTACTAAAAA TACGACAAGA ATAATTAATC 1320 

CGACACCGTT AATTAATGGC GCATCGTCTA GTAAGCTGCC TGTTTTAGCA TTTCTTAAAA 1380 

AGCTATGTTC AGGAATGGCT GTAATAATTA ATAAAATAAT TGTGACTATG AAACTGATAT 1440 

55 



25 



30 



35 



45 



50 
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CATCATGCAT 


TAAACTGTCA 


TCATATTTTC 


CTAATCTAGG 


AATAATGAGC TTAGTTGTAA 


1560 




CTAGCAATAT 


CGTAGGAAGT 


AATACAACGA 


CACTCGCTGC GATAAAGTAC CAGTTCATAG 


1620 


5 


CAACGTTTGT 


TTTAATAGAA 


TCTGAAACGA 


TACGTGTTGC 


CGGTTCTGTA AATGAATAGA 


1680 




CCAAAGCATC 


TTGCATACCA ACAACTATAT TTGCTGCAAA TCCTCCAACA GCGGAAGCAT 


1740 


10 


ATGCCATCGT 


TAGTCCAGCG 


ATAGGGTGAT 


AGCCAATTTT 


AATAAAAAGC ATTGCTGCAA 


1800 


GCGGCGGCAA 


GATAATTGTC 


GCAGCATCGC 


CGGCTGTACT 


ACCTAAAATA CCAATTAATA 


1860 




TAATAGTCGG 


TAAAATTAAG 


AAACGTGGTG 


CGCGATTCAC 


AACAGAAATC ATTAACTTAT 


1920 


15 


CGAAGTATCC 


TGTTTTCTCT 


GCAACACCAA 


TACCAATCAT 


CACTGCTAGT ACTAAGCCTA 


1980 




ATGCTGGGAA 


CTCTGAGAAA 


TTTTTAATCG 


TATCATTCAT 


TATCATCGTA AATCCATCAT 


2040 




GGCTAATTAT 


ATTTTTAATA 


TAAATGGTTT 


GATGCGTACC 


TGGATGCTTA ACAGATACAT 


2100 


20 


TAAATAATGA 


GATAACCCAT 


GTCATAATGG 


CTAAGCCCAC 


ACACATTAAA AAGAATAAGA 


. 2160 




CGCTAGGATC 


TGGCAATTTA 


TTTCCGATTT 


TTTCAACACT 


ATTCAAGAAA CGATTGACGA 


2220 




TAGACCCCTT 


TTGTTGATGT 


TTTGATGTCA 


TCAATTATTC 


CCCCCTTTGT TAAATATTTA 


2280 


25 


AAGTGTAACA 


AAAAATACTC 


TCAAAAGTAA 


CAATTTTCAG 


GAAATAAAAA AACTAATATT 


2340 




GTTAAATATT 


TTGAGTTATT 


CAATAGAAAG 


TGTATAGCAG 


AGTAGTTAAG ACTGCCTGAA 


2400 


30 


GACTTATCTA 


TTAGGTTTAT 


GAAGCATCGA 


ACAGTGGAAA 


ATAAGGACTG TAAGTTTAAG 


2460 


ATATGTTGTA 


TAGGAGTGAC 


TGAATGAAAC 


GTTTGGAAAA 


TAAAGTAGCA GTCGTAACAG 


2520 




GAGCAAGTAC 


AGGTATCGGT 


CAAGCTTCTG 


CAATCGCTTT 


AGCTCAATAA GGTGCGTATG 


2580 


35 


TATTGGCGGT 


AGACATAGCT 


GAAGCGGTAT 


CGGAGACTGT 


CGATAAAATT AAAAGTAATG 


2640 




GTGACAATGC GAAGGCGTAT AATGTGGATA ATGCAAGCGA 


ACAACAAGTG GTAGACTTTG 


2700 




TGTCTGACAT 


AAAGGAACAG 


TTTGGAAGAA TCGATGTGTT 


GTTTAATAAT GCCGGTGTGG 


2760 


40 


ATAATGCGGC 


TGATAGAATT 


CATGAGTATC 


CAATAGATGT 


GTATGACAAG ATTATGAATG 


2 820 




TAGATATGCG 


TGGGACATTT 


TTAATGACGA AAATGATGTT 


ACCTTTAATG ATGAATCAAG 


2880 




GTGGCTCTAT 


TGTTAATACG 


TCTTCATTTT 


CCGGACAAGC 


AGCAGACTTG TATCGCTCTG 


2940 


45 


GATATAATGC 


TGCGAAAGGT 


GCAGTGATTA 


ATTTTACAAA 


ATCAATCGCA ATTGAGTATG 


3000 




GCCGTGATAG 


CATTCGAGCC 


AATGCGATTG 


CACCAGGTAC 


AATTGAAACC CCGTTAGTAG 


3060 


50 


ATAAACTGAC 


AGGTACGAGT 


GAGGATGATG 


CAGGTAAAAC 


ATTTAGAGAA AATCAAAAAT 


3120 


GGATGACTCC 


GCTGGGACGT 


TTAGGTAAAC 


CAGAAGAAGT 


TGCTAAATTA GTAGTCTTCT 


3180 




TAGCATCTGA 


CGACAGTTCA 


TTCATAACTG 


GAGAGACGAT 


TCGAATTGAT GGTGGTGTGA 


3240 



S3 
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15 



20 



25 



35 



45 



AATTATTTAA AATCGATATC 


CAGTGGAAAA GAATTTGGCA TGAAGTAGGC 


AATGTATGCA 


3360 


TATTGTCGCA ATGAAAGACA TTTAAAGCGG AGATTAATTA ATCTTTGAAA 


ATCACATATT 


3420 


GTTCATTTGA 


AGTGTATTGC 


TTAAAGCTTG 


TTTTAACGTA 


TTGTAGGTCG 


TGCATCTAAT 


3480 


TTATCAGAAT CTCGAGTTCA AACTTTTGGA GTATCTTTAA AATAAGCTGT 


ATTTTGTCTA 


3540 


TTCTAATAAA 


TTAAGGAGAA 


TTTTATGTTA AAAGAAAAAG AAAGTTTTAG 


ATTGCTATAT 


3600 


CAAGCTATAA 


GAGAGATTGC 


AGATAAAATT 


GGAGATAATC 


AGTTAGAAAC 


TAATTCCGTT 


3660 


AGTTTATtAT 


tATTGGACTT 


TGATTTTGAA 


CATGAAGTAT 


TTGATGAATT 


GTATCTTGTG 


3720 


ATTTtAAAAT 


ATTTAAATAC 


AGTAAGTATA 


GAGAACATAA 


GTCATAGTGA 


GCTT 


3774 


(2) INFORMATION FOR SEQ ID NO: 661: 








(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1078 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 








(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 661: 






TACTGGTTTT 


GGATTTTGGA 


GGTAATACAG 


TACCTAATAG 


TAATnATGGT 


GTCGTCAnAA 


60 


TTATATCTTT 


CCGTGATGTT 


CTTACTCATT 


AGAACATCnG 


CCTTCAGAGG 


AATCATGATA 


120 


CGAGGAATAA 


GAAATTTAAA 


TGTGAGCGAA 


GTCAATATAG 


TATTTGCGAT 


TATTTTTATT 


180 


AACTCCATTA 


TTATTGTTAG 


TTTGATTTTT 


CGAGGATAAC 


TTCAATTTTT 


GCATTTTGAG 


240 


GTTTTTTAAC 


ATATCTATTT 


GCATCAGTTG 


ATGGCAACCT 


TTTACTTAAA 


TCTATTGTGT 


300 


AGTTATTGTC 


TGCACCTGTT 


ATTTTAATTT 


GTCCTTTATT 


ATAAGAATTA 


TTATATAATT 


360 


TTTTACTTTT 


AATTAATGTT 


TGACGAATAC 


GAAAATCTAA 


TTCTTTTAAA 


GTTAAAACAG 


420 


GCTTATTGCC 


TTCATAAACT 


GGAAATCCGC 


CAGTAAACGT 


TTCTGCTTTA 


TCTTTATATG 


480 


TTACATTCAG 


TTTATAGTGT 


TTATCGTTAG 


ATGTTGCTGC 


AGGAGTAACA 


CCACCAGTAA 


540 


ACGTTTCTTG 


AGATAATGCA 


AAAGaATCAA 


TGGTTTCTTG 


GTCTTTTATG 


CyAAAAATAT 


600 


CAACGCTTTT 


ATTTCTTAAT 


TGGTTGATAT 


TGCCCCAACT 


TTCAGGTCCA 


TAAACTTGAA 


660 


TATGACTATA 


CCAAGaAAAC 


TGTAACAACG 


TTGCATGAAT 


CgTACCGTTA 


tctttttgcc 


720 


ATAACGTACT 


GTTAGAGAAG 


GTTAAATATT 


TTTGCGAGTA 


ATATTTAGTT 


AACTCATTAA 


780 


CGTTAGTTTC 


GTTTTGATTT 


ATATAAtAAG 


CTTTCGCTTC 


AGATGAAGAA 


TTGATAJcGTG 


840 


TATTAGGAAA 


TTGTGTAGAT 


GCTGTACCTA 


ATAGTAACAA 


TGTTGTTGAT 


AAAATAATTT 


900 
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IS 



30 



35 



40 



45 



SO 



ATAAAAAGGG 


GTTAATTAGA 


TAATTGAAAT 


TATCCGCATT 


TACAAAAGGT 


AATAGGTTAG 


1020 


TTAGATTTTT 


CGAGTATGAC 


TcAATTTCTG 


CATTACGAGG 


nJ. Ill InftUi 






(2) INFORMATION FOR SEQ ID NO: €62: 








(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 13 98 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 








(xij J 


SEQUENCE DESCRIPTION: SEQ ID NO: 662: 






AACTTGCTTT 


TTAGTATCTA 


CGTTAATATT 


AATAGCTTTA 


ATTTCACTTG 


TATTAATTAA 


60 


ATCAGCTGTG 


TAAATACCTG 


CTTTCAAATC 


GATAACTTTC 


TTTGTTCCAT 


TTTTAAAGTA 


120 


AACAGTATAT 


TTCGCTTGCT 


TCGATAGTCT 


TAAATCTATA 


TCACTAATAC 


CTCTGTCTGA 


180 


TTTTAAAACT 


GATTTAACTC 


TATCCTCTAA 


ATCTTTATAA 


CTAATATTTT 


GATTCTTATT 


240 


AAATGTTAAG 


CTTGATAAAA 


TATTTTGGCT 


TGTACCGTTC 


ACAGTGaTTG 


CATATGGAAC 


300 


ATGGACTTTA 


GAATATCCAT 


GGTGTAACGA 


ACTTGATGAT 


TTATCTAATG 


GCTTAGCTGC 


360 


GGCAGACGCT 


TCATTATTAT 


TAAAGTTTGC 


ACCTGTTGAT 


GCTAAAACAC 


CTAATGCTAA 


420 


AGTTGTTGTA 


ATCAATGACT 


TAAATTTCAT 


AAATTATCTC 


TCCTTTTTTG 


TGTAATTCGT 


480 


ATTTGCAACT 


TAATTATAGC 


CAGACTTTCT 


CTATTTTTTG 


AATTAACTGA 


ATATTAATAA 


540 


TAAATTATCT 


TTAACAATAA 


TTTTTTAACA 


CTGTTAAAAG 


TTCTTTTAAT 


TTTGATTAAC 


600 


TAATTAATTT 


ACAATACCTA 


AAATGTTGTT 


TGGTTTTGTT 


TATACCAAGC 


TTCAAACTTA 


660 


AATGTCATAA 


CAACATTCAT 


TTCTTAATTC 


CTATTAGATT 


TGTCGATTAT 


ATTTACAGCA 


720 


TCTTTATACT 


CAAAAAACAT 


TTACTTAAAA 


ATATAAATTC 


GATTTAATAA 


TTAATTTAAA 


780 


TTTAGTTAAT 


CAATTTTGCA 


TCTATTTTGT 


TGTAAGCTAT 


ATAAAAGGAG 


TGATAATGAT 


840 


GGTGAAAAAA 


ACAAAATCCA 


ATTCACTAAA 


AAAAGTTGCA 


ACACTTGCAT 


TAGCAAATTT 


900 


ATTATTAGTT 


GGTGCACTTA 


CTGaCAATAG 


TGCCAAAGCC 


GAATCTAAGA 


AAGATGATAC 


960 


TGATTTGAAG 


TTAGTTAGTC 


ATAACGTTTA 


TATGTTATCG 


ACCGTTTTGT 


ATCCAAACTG 


1020 


GGGGCAATAT 


AAACGCGCTG 


ATTTAATCGG 


ACAATCTTCT 


TATATTAAAA 


ATAATGATGT 


1080 


CGTAATATTC 


AATGAAGCAT 


TTGATAATGG 


TGCATCAGAC 


AAATTATTAA 


GTAATGTGAA 


1140 


AAAAGAATAT 


CCTTATCAAA 


CACCTGTACT 


CGGCCGTTCT 


CAATCAGGGT 


GGGACAAAAC 


1200 


TGAAGGTAGC 


TACTCATCAA 


CTGTTGCAGA 


AGATGGTGGC 


GTAGCGATTG 


TAAGTAAATA 


1260 
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CAACAAAGGC TTTGTTTATA CAAAAATAGA GAAAAATGGT AAGAACGTTC ACGTTATCGG 1380 
TACACATACA CAATCTGA 1398 
5 (2) INFORMATION FOR SEQ ID NO: 663: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1200 base pairs 

(B) TYPE: nucleic acid 

10 {O STRANDEDNESS : double 

(D) TOPOLOGY: linear 



15 



(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 663: 

TTGTAATTGG AACGTACGAA CTTTTCTAGG TAAGAAACGT CGAATCTCGT CCTCATTATA 60 

ACCAACTTGT AGTCGTTTAT TATCTAAAAT AATTGGACGA CGTAATAAGC CAGGATTATC 120 

20 TTGAATGATT GAATATAAGT CTTGTAATGG TAGTGAATCA ATATCAACAT TTAATTTTTG 180 

GTATGTTTTA GAACGTGTAG AAATGATTTC ATCAGTACCG TCTTCAGTCA TTTTTAATAT 240 

TTGCTTAATT TCATCAATTG TTAAATGTTC AGAAAAAATA TTACGCTCCG TATACGGAAT 300 

25 GTCcATGTTC tTGkTAACCA TGCTTTCGCT TTTACGGcAA GATGTGcAaC TTGGtGaAGT 360 

aAATAATGtT ACCATACATC . TCACTCTCCT ATTTGAATGA ATAAAATTCA TTGCTTAAAA 420 

TTTAGTTATA GATCAAGAAA AAACATTTTT TTCTAAAATT CTTAATCGTT ACTATTTATT 480 

ATAACTATCT AACATTAAAA TTAAATGAGA AAAACCTAAT TTTTCAGATA AGTTTCTACA 540 

CTTATAAAAA AGATTATTAA TCCCTTTGTT AGTAGTAAGT TATACGTATA TTCTAACACA 600 

TCTTACATTT TTAAGAAATA CTGTTATAAT GATAATTATT AAAATATTAC TAAGAAAGTA '660 

GGCATTTAAA TGGAGACATT ATTTTCAGGC ATCCAACCTA GTGGAATTCC TACTATTGGA 720 

AATTATATTG GCGCACTAAA ACAATTTGTT GATGTGCAAA ATGACTATGA TTGTTATTTC 780 

TGTATCGTAG ATCAACATGC AATTACAATG CCACAAGATC GTTTAAAATT ACGTAAACAG 840 

ACCAGACAAT TAGCAGCGAT TTATTTAGCT TCTGGTATAG ATCCAGACAA AGCAACATTG 900 

TTCATACAAT CTGAAGTCcC TGCACACGTA CAAGCAGGAT GGATGTTAAC TACGATTGCT 960 

45 TCTGTTGGAG AATTAGAGCG TATGACGCAA TACAAAGATA AAGCTCAGAA AGCAGTTGAA 1020 

GGTATACCTG CTGGTCTATT AACATATCCA CCTTTAATGG CAGCTGATAT TGTTCTTTAC 1080 

AATACTAATA TCGTTCCAGT TGGAGATGAC CAAAAGCAGC ATATCGAATT GACTCGTAAC 1140 

60 CTTGTAGATA GATTTAATAG TCGCTATAAT GATGTGCTTG TGAACCTGAA ATTCGTATGC 1200 
(2) INFORMATION FOR SEQ ID NO: 664: 
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(A) LENGTH: 787 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS: double 
(D) TOPOLOGY: linear 

5 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 664: 



10 


TGTACCTTTT 


GCTTTAATAA 


ATACTGTTTC 


TTTATCATAA 


TTAGGTTCAG 


TTAAGAAATT 


60 




AAATTGTAAG 


CTTTGAGTAA 


TATTTTTTTG 


ACTATCACTT 


GTTGTAGCTG 


TACGTGTATA 


120 




CATTTTAGTA 


TCACCATCAA 


GATTCTTCTC 


AGAAACTTGT 


TTGATTTCAG 


AATTAATCTT 


180 


15 


TGCAAATGAA 


GTAGCTGGTA 


ATACAGTGAA 


AGTAGTCGAT 


AGTGCTAAsG 


wACAAATTGT 


240 




GATATTTTTA 


CATAGTTGTT 


TAATCATTAG 


TAATCCGCCC 


TTTCAATATT 


ATCCTTCTTT 


300 


20 


ATAAGGTTTA 


TTGTCATCAG 


AATATTTATC 


AACGACTTTA 


ACTGTTTTAT 


TTTTCCAATC 


360 


AACTTCATAA 


GTGACAATTA 


ATCTTTGACC 


ATCTTTATTT 


TtcTCTAAAA 


TTGGAGGTGC 


420 




ATAATGTATy 


CCAGGTCTGT 


TTTTCAAAAT 


ATCTTGATTT 


CGTGTGTATG 


TTACTTCAAA 


480 


25 


TTGCGTTTTC 


TCATTTGACT 


TTTCATTAGA 


TAAATAAGTT 


AAAAATTCTG 


GATTAAAGCC 


540 




ACTTCTTACT 


AATGCTGGGT 


ATCTATATTT 


TGAAGCAAAG 


CTTAGTTCaG 


GGTTTTCTAC 


600 




AGTAGCAATT 


CTCGTATTTC 


TATAGAATAA 


TAATTCATCA 


TTTCTATTTT 


TCACTTCTCC 


660 


30 


ACCATACTTC 


AAGTCATTCG 


CAATAACTGA 


CCAGTGTACA TGgCCAGTTn ATTTATTTTT 


720 




ACCGCTGGCA 


ATTGTGTCAT 


AATTTGCTGC 


ATCATCAACT 


AATCGTTTTG 


GAAGTAGCTA 


780 




TTTGCTG 












787 



35 

(2) INFORMATION FOR SEQ ID NO: 665: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 533 base pairs 

(B) TYPE: nucleic acid 
40 (C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



45 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 665: 

TTATCTGTCA TTAACCACTG GTACATGTGA ACCCGGCnTn AATCAATATA TATATTTAAA 60 

AGCAAAGGCG CGCCATGTGC CTTTtTTnTA tTTTGTATAT CTGTATCAAA ATCGATTTGA 120 

50 

TTAAAATCCG CTTTATTTTA TCATCTATTC AAATGATTTT AGTGCGCTTA TTTTACTATG 180 

GCATTATTGC CTAACCTGTT TGAGATATAT TAATATTTGA TGATTCGTAT TCAAAGTTTT 24 0 

CATTTAACAT GTATTTAGTA TCATGATAGC TGCTTCATTG ATGATATACT ACCTACTTTT 300 

55 , ' 



1588 



EP 0 786 519 A2 



CAGAGGCAAT ATTGAACAAT TCTTCATCAT GACTATTTTC CATCACATAA CTATGCTTAG 

CGAACGCTAA CATATCTTTA TCATTATTCG CATCTCCGAA GGCCATGAGC TCTGAAGGAG 

ACATTTCCCA TTTATCTAAC AATCGTTTTA ATGCCTGnCC TTTAGTCATG TTT 

(2) INFORMATION FOR SEQ ID NO: 666: 

(i) SEQUENCE CHARACTERISTICS : 

<A) LENGTH: 400 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 
<D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 666: 

GACTTCTCTT GCACTAAAAA TTGCTCAAAT TGCTCGCTGT CATAACCAGG CGGTGTTTCC 

AACCATACAT ATATGCCACC TTTAGCATGA ACAAATGGCA AATCAGCTTT TGCAAGCATG 

GCTTCGAATC GGTCACGACG TGTTTTAAAT ACATTGCTTT GTTCTTCTAA AAAATCATCA 

TAATGGATTC AAAGCATATA TTGCGGTCAT CTTGTAAATG CACCAAACAT CCCAGCATTT 

GTGTGCGTTT GGTACTTTTT CAAAGCTTGA AATCATATCT TTATTACCAA CTGCCAAAAC 

CGACTCTGAA AACCTGGACA TGTTGATGAA CCTTTnAGAC AAGGGAAGAA ATTTGCAATC 

GCAACATCTT TGCCCATTTT nCCGAAGCAA GTGnGACTAG 

(2) INFORMATION FOR SEQ ID NO: 667: 

(i) SEQUENCE CHARACTERISTICS: 

<A) LENGTH: 412 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 667: 
TCTCCAATGC TACTCAAATT AAAAAGGTTT TAAATATTGT TAATTCTGAT CCAGAGCGAA 
AGATTGTTAT CGTTTCTGCT CCAGGTAAAA GACATGATAA TGATATTAAA ACAACTGATT 
TGTTAATCAG ATTATATGAA AAGGTCATTA ATCATCTTGA TTATCATGAT AAAAAAAGAG 
AAATTATTCA GCGTTATGAT GATATTGTAA AAGAATTGCA AATGGATGAA AGTATTTTAC 
GGACGATAGA TGTGACTTTG GAACATTATA TAAATCAATT AAAAAATGAA CCAAAGAGAC 
TATTAGATGC ATTACTTTCT TGTGGTGAAG ATTTTAATGC GCaAyTGAtA GCyTTATATA 
ATAAtAGTCa gGTt ACCAAC AAmATwTATA TCCcCGAAGG AAGCGGGTAT TT 
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(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 400 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: ' SEQ ID NO: €68: 

TO 

TTACTCGTTA AAGATATTGT AAAAGATGAA GTGACAGAAT ATGACATTCA TCAAATGTTA 60 

CCGCATCCGA TTAATATGGT AAGGGTTAGA CTTTTTGGTG TGAAATTAAA AGAGATTATA 120 

15 GCTAAAAGTA ATAAACAAGA nTATATGTAT GAACATGCAC AAGGTTTGGG TTTCAGAGGG 180 

AATATATTTG GAGGATATAT TCTTTATAAT TTAGGGTACA TTCATTCTAC AGGGCGTTAC 240 

TATCTGAATG GAGAAGAAAT CGAGGACGAC AAGGAATATG TACTAGGTAC GATAGATATG 300 

20 

TATACGTTCG GTCnTATTnC CCAACATTGA AGGATTACCA AAGAGTATTT AATGCCAGAG 360 
TTTTTCAGAG GTATATTTAA nGAAAATTAT TGGCTATTTA 400 
(2) INFORMATION FOR SEQ ID NO: 669: 

25 

. (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1236 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
~ (D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 669: 



35 



45 



TGTTCGATAT 


TTTTAAATTT 


ATCTTTTAAA 


TACAACAACT 


GTTTCCGTAA 


TGATTTAACT 


60 


GTTTTATGAC 


TAATGCCATT 


GAATATTTCT 


AGCGTTTTAT 


TTAACTTATC 


GATAATCGCA 


120 


TGTAAATCCT 


TCAAAATGTC 


TTTTGTTTCA 


AAAGTAAATA 


CATTATGGAA 


GCGATGAATA 


180 


TCATCATCAT 


AAACATCAGA 


ATCATTGATA 


ATCGTAAATA 


TCGTTGAGAA 


CAATTGCTCA 


. 240 


TTTAACTCAT 


GAATCTCATT 


CATACTAGCC 


TTCAAGCCAA 


AAATATCAAT 


TGGTGCAATA 


300 


TCTAATTTTT 


CCAAAATTCG 


CTGCTTTTCC 


AGTTGATCAA 


TTGCCTTTAA 


CAATTTTTCA 


360 


TTTTCGTTTT 


TACCAATCAA 


ACCAAGCTGA 


TATTTAATAT 


CAGCATAACT 


CAACTCATTT 


420 


GTCACTTGAT 


TTAAGGCATA 


GTCTGGTAAG 


CGATGTGCTT 


CATCCACTAT ACAATCATCA 


480 


AACAATTGAT 


ATATTGAATT 


TTCAACATCA 


GAATGaATTA 


AATGTGCATG 


ATTTGTAATA 


540 


CCAATTTGaA 


TGTTCTGTGC 


ATTTCGCTTA 


ATAAAATTAT 


aATAATGAAC 


ATCGTGACGT 


600 


GCCGGTACAT 


ATGTTTCAAT 


TTTCTGGTcA 


AAATACATCT 


TTTGACCACC 


TTTTAAATTT 


660 
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ATATTCACtT CGTAATTACT TGTGTCATCT TTTAAAATTT GACTAATAAG CCCCAATGAA 780 

ATGTAATCaC TTtTACTTTT AATCAATAGT GCATTAATTT TAAAATTCAA CGCTTCATTC 840 

5 

ATTGCTGGAA TATCTTTTTC TAACAATTGA CTTTGCAGTA ATTTAGTATT GGTAGAAATC 900 

ATGACATGCT TCCCAGTTTC AATATTATAC ATCAAGGCCG CAAGTAAATA TGCTAATGAT 960 

w TTACCACTGC CTAGTGATGC TTCAATCATT GCTTTTTCAC TATGCATGAG CTGATCTAAT 1020 

ATAGTTTCCG CTAAATATAA TTGTTGCGGT CGATATGTTA AGCCAAGTTG ATCTACAGCT 1080 

TTGCTATATA AAGACTTCAA GCTGCCATTA TAATTTGTTG TCGGCTTTTT AAAATCAACT 1140 

15 TGCTTACGAT AGATAATCTG TTCGAACTTT TCGTACGATT TATCCAATGG CTTTGCATCA 1200 

TATTGCCTAA CCATCTCAAA GAAAATATCA TACAAA 1236 

(2) INFORMATION FOR SEQ ID NO: 670: 

i 

20 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1819 base pairs 

(B) TYPE; nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 670: 
30 ACASAATTAT TGACCAATAT GACTCGTGGA 

CATTTAAAGC ATATGGCGTT CTATTTATAG 

AAGCGCCTAT GTTTAAAAAG ATTTTGAAAA 
35 CAACACAACA ACGTACTCAA AATCAAGGCT 

TTCATTTATT CTTACATGAT GAAAATATGC 

TTAmATTAAA TAAAACAGAT AAGACATATA 

40 

ATCAACCkGA ATTATTTTCT aATAATGTAG 

TTGAACACGG TGGCATTTGT TGGAGGACCG 
^ GATGTATTTG AACTATTTGA TGTTGAAATG 

TATTTAAATG ACCGTATAGA AAAATTACTT 

TTAGTCGATG GTGTTGAAGG AGAAAGAAGT 
SO TTTATTGAAA AGGTAGAAGG TATGATTGAA 

GATGAAGTGG CGGGGAATCA AAATAATATT 

ATACAACAGT ATGATTATTT GTTAAAACGT 

55 



CTGATATGTT TAAAGCACTA CTGCATGAAA 60 

ATGCGCAGTT TGAGCCGTTA AGAAAAATGG 120 

AACATCAGTT GCTTGATGAT GCTTTTAGAG 180 
TGAATGCGAT GATACAAACA GATACAAATG ' 24 0 

GTCAATTAGT tTCGTATGAT GGTAAGCAyT 300 

TAAAGGAAGA AATTATAAAT ATTGCGGAAA 3 60 

TGACAAGACC ATTAATGGnA GAATGGTTAT 420 

AGTGAAATTA AGTaCTGGGC TGAACTAAAA 480 

CCtATCGTGA TGCCAAGGCT TAGAATTACT 540 

TCGAAATACA ATATTCCATT AGAAAAAGTG 600 

AAGTTTATTA GAG AACAAGC ATCACATCAA 660 

CAACAGCGTC GTCTAAACAA AGACTTATTA 720 

AACCTTGTGA ATAAAAATAA TGAAATTCAT 780 

TATCTTTTAA ACATTGAAAG AGrAAACGAC 840 
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GAAAGAATAT GGAATCCACT TCAAATTTTG AATGATTTTG GGACAGATGT GTTCAAGCCC 960 

TCCACCTATC CACCACTTTC TTACACTTTT GATCATATTA TTATAAAACC TTAATATACC 1020 

5 

AAGGGTTTAG CCCGATTTAT CTTAATGATA AATCGGGCAT TTTTTTGTTT TTTAAAATAA 1080 

ATTTCACAAA TTTTGTATAA ATAGTGGTGG ATAGTGGGGA GATGTGGTAA ATTATATATA 1140 

10 AGGTGAGGTG ATAAAAAATG TTCATGGGAG aATACGATCA TCAATTAGAT ACAAAAGGAC 1200 

GTATGATTAT ACCGTCCAAG TTTCGTTATG ACTTAAATGA GCGTTTTATT ATCACAAGAG 1260 

GCCTTGATAA ATGTTTATTC GGTTACACTC TAGACGAATG GCAACAGATT GAAGAGAAAA 1320 

15 TGAAAACCTT ACCTATGACA AAAAAAGACG CACGTAAGTT TATGCGTATG TTCTTCTCTG 1380 

GTGCTGTTGA AGTAGAACTT GATAAGCAAG GGCGTATTAA CATCCCTCAA AACTTGAGGA 1440 

AATACGCTAA TTTAACTAAA GAATGTACAG TAATCGGTGT TTCAAATCGT ATTGAGATTT 1500 

20 

GGGATAGAGA AACTTGGAAT GATTTCTATG AAGAATCTGA AGAAAGTTTC GAAGATATTG 1560 

CTGAAGATTT AATAGATTTT GATTTTTAAA ATGGAGGAAT TGAAGtGTTT CATCATATCA 1620 

GCGTTATGTT AAACGAAACC ATTGATTATT TAAATGTAAA AGAAAATGGT GTGTACATTG 1680 

25 

ACTGTACGCT AGGTGGAGCG GGACAnGCCC TTTATTTACT AAATCAATTA AATGACGACG 1740 

GAAGATTAAT AGCAATCGAT CAAGACCAAA CTGCAATTGA TAATGCTAAA nGGGTATTAA 1800 

30 AGGATCATTT GCATAAAnG 1819 

(2) INFORMATION FOR SEQ ID NO: 671: 

(i) SEQUENCE CHARACTERISTICS: 
3S (A) LENGTH: 609 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

40 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 671: 

ACCAATTATT GGACAGGAAT TAGCAAAAAA TGCAATGCTT GCATTAATCT ATGCATCGAT 60 

45 AGGTATCATC ATCTATGTAT CATTACGATT TGAATGGCGC ATGGGTCTTT CATCTGTATT 120 

GGCATTATTA CATGATGTAT TCATTATAGT AGCGATTTTC AGTTTATTTA GAATTGAAGT 180 

AGATTTAACA TTTATCGCCG CTGTATTAAC AATTGTCGGT TATTCAATTA ATGATACAAT 240 

50 CGTAACGTTT GACCGTGTAC GTGAAAACTT ACAAAAGGTT AAAGTGATTA CGACAACAGA 300 

ACAAATTGAT GATATCGTTA ATAGATCAAT tAGACAGACA ATGACACGTT CAATTAATAC 360 

AGTATTAACA GTTATTGTAG TAGTAGTTGC TATACTATTC TTCGGTGCTC CTACGATATT 420 
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TGCCGTTCCG CTATGGGGAA TAATGAAAAA ACGTCAGTTG AAAAAATCGC CGAAACACAA 
ATTAGTTGTA TATAAAgAAA AGAAATCGAA CGATGAAAAG ATTTTAGTTT AAAAtGaATT 
AAGCGGTAT 

(2) INFORMATION FOR SEQ ID NO: 672: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 2222 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 672: 
CTTAAAACAG CAATTTGAAC GTTTACAAAA TGAACAAATC TTTGTTTATG TTTGTCATGG 
TAATCACGAT CCTTTATCAT CAAAGATTTC ATCAAACTGG CCAGATAATG TtnTTGTATT 
TTCAAATAAA GTTGAGACGT ATGAAGCAAT . TACTAAATCT GGTGAAACAA TTTATATTCA 
CGGATTTAGT TATGAAAATA GAGCAAGTTA TGAGAACAAG ATTGATGAAT ATCCATCAAG 
TCAAGGCCAA AAAGGCATAC ATATTGGTGT CTTGCATGGT ACGTATAGTA AATCTTCAGT 
TAACGAAAGA TATACCGAGT TCATTTTAGA AGATTTAAAC AGTAAATTGT ATCATTATTG 
GGCTTTAGGT CATATACATG AACGTCAACA ATTAAGTGAT ATGCCTGTAA TTAACTATTC 
AGGTAATATT CAAGGTAGAC ATTTTAATGA GCAaGGTGAA aAAGGTTGCT TATTAATCGm 
GGGTGACCAC TTAAAATTAA AGACTAAATT TTATCCTACA CAGTATATTA GATTTGAAGA 
AGCAACTATT GAAACGGATA AGACATCTAA GCAAGGTTTA TACGAGGTCA TTCAAAACTT 
TAAAGAACAA GTGAGAGAAG AAGGAAAAGC CTTTTATCGT TTAACGCTTG TTATTAATAG 
TGAGACATTA ATTTCACCTC AAGATTTATT ACAAGTTGAA GAAATGATTA CAGATTATGA 
AGAAAACGAA AATCAATTTG TATATATTGA TGAGTTAAAA ATACAATATG CACAAAATGA 
TGAGTCACCT TTAGTTAATG AATTTTCAGC GGAATTATTA GTCGATCAAA CTGTTTTTGA 
TAAAGCGATG TCAGATTTAT ATTTAAATCC AAGGGCATCT AAGTTCCTAG ACGATTATGG 
AACATTCGAC CATACAGCAT TAGTTAATCG TGCTGAAGAA ATATTAAAAG CTGAAATGAG 
AGGTGAACAA AATGATAATT AAATCACTTG AAATTTATGG TTACGGTCAA TTTGTTCAaC 
GTAAAATTGa ATTTAATAAA AACyTCaCTG AAATTTTTGG TGAAAATGAA GCGGGTAAAT 
CGACGATTCA AGCATtCATC CATTCGATAT TATTTGGATT TCCAACTAAA AAGTCTAAAG 
AGCCAAGACT AGAACCACGT CTAGGTAACC AATACGGTGG TAAATTAGTA CTTATTCTTG 
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10 



TATATTTACC TAATGGTGCT GTGCGTGATG ATGCTTGGTT ACAAAAGAAA CTTAATTATA 1320 

TTTCTAAAAA GACATATCAA GGTATCTTTT CATTTGATGT ACTAGGGCTT CAAGACATTC 1380 

ATAGAAATCT AAATGAAAAA CAATTGCAAG ATTATTTATT ACAAGCmGGG GCTTTAGGAT 1440 

CAACTGAaTT CACGTCAATG CGCGAAGTGA TTAATCGTAA AAaAGATGAA TTATATAAAA 1500 

aATCAGGTAA AAATCCGATC ATTAATCAAC AAATTGAGCA ATTAAAACAA CTAGAAAGTC 1560 

AAATTCGTGA AGAAGAAGCA AAGCTAGAAA CATATCATCG CTTAGTAGAT GATCGAGATA 1620 

AATCATCACG TCGATTAGAG AATTTAAAGC ATAATTTAAA TCAATTATCA AAAATGGATG 1680 

15 AAGAAAAACA AAAAGAGGTT GCTTTACATG ATCATTCACA AGAATGGAAG TCTCTAGAAC 1740 

AACAGTTAAA TATTGAGCCA ATCACATTCC CAGAAAAAGG TGTGGATCGT TACGAAAAAG 1800 

CACGAGCGCA TAAGCAATCG TTAGwAAGAG ATATTGGTTT AAGAAATGAG CGTTTAGCTC 1860 

20 AACTTAAAGA AGAAGCGACT CAATTAGAGC CAGTTAAACA ATCTGATATT GACGCCTTCA 1920 

TTAGTTTGAA TCAACAAGAA AATGAAATTA AAAATAAAGA ATTTGAACTT ACTGCAATCG 1980 

AAAAGGATAT TGCGAATAAA CAACGTGATA AAGATGAATT GCAATCAAAT ATTGGTTGGT 204 0 

CTGAAACGCA TCATGACGTA GATAGTTCAG AGGCAATGAA AAGTTATGTC AGTGAGCAAA 2100 

TCAAGAATAA ACAAGAACAA GCTGGATACA TTAAACAATT AGAACGTAGT TTAGAAGAAA 2160 

ATAAAATCGA AGATAATGCG GTTCATAGCG AACTAGATTC TGTTGAAGAA AAATAGTTCC 222 0 

TC 2222 
(2) INFORMATION FOR SEQ ID NO: 673; 

35 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 406 base pairs 

(B) TYPE : nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

40 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 673: 

TTGCAGGTAT CATTTTTTTA ATGCCATATG GATTATGTTT TCTACCGTTT TATAAGCAAA 60 

45 

AAAAGAAAAA ACAGACATTT AAAAAATACA TGGTTTACAC TACGATTGGT TTGTCAATTT 120 

GTCTAGGCTT ATCTCTAGTT TTGGTTCACA CTACGAAAAT TTATATGGAC GAAGGTGGCG 180 

50 TAAGATACTA TTACGGTAGT TTTGTAATGA AACAAGCGGG CGGTTATGCT TATTTAGCTT 240 

TAGCGGTACT TTCAACGTTG TTAATTGTTG CGAAAAAAGC TACAAATAAA AATAAAGAAA 300 

TCGAAACCGT CGACAATACA AATATAACGG AAAGATAATT AAGGGAGTGC TCATTCAGGA 360 



25 



30 



55 
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(2) INFORMATION FOR SEQ ID NO: 674: 

(1) SEQUENCE CHARACTERISTICS: 

5 (A) LENGTH: 927 base pairs 

(B) TYPE: nucleic acid 

(C) STRAND EONESS : double 

(D) TOPOLOGY: linear 

10 , 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 674: 

CCACTTTGTG GATTTTCTTT ATATTCTCCA CGCTTGtACT ACAACTTCTT TCGTTTCTGT 60 

1S TTCATCACCG ACTGCCGCAT TCGTTAGCAC ATGTAATAAC TCTTTTGCGG TTAATACATT 120 

CTCATCTATA ATCTTATCTT TTTGTTCTTG TATATATTGC TTGATGTGCG GCTTTTTCAA 180 

TAACCTACAC GCTGTCACAT GTGCGCTATT TGCGTTATAT CCTGyTTTTA TGGCACTTTG 240 

20 TGTTACATTC AGTGTTCTAA TATACTCATT CACAAAACGT GCTTGCTTTG CAGTTAACTC 300 

ACTCATTTTA TCACCCCCAC AATTTTATCT AATATGGTTT CATACCATAA TATTACAGAT 360 

TGTTCTGAAC AATCTAAGGC ACTACTAATA TCTTGATAAC TAAGTCCTTG TATAAGGGAG 420 

25 

TCAAAAATAT AAAACTCTTT ATCGGTCGCT AATCTGTCAA CAATCATTTC TATGTGATTC 480 

TTTATAATAT GATCATTGAC ATTATCGTCT GTCATCAATT CGTCAGAATC TTCATCACCT 540 

ATTAAAAAGA AATCATCAGT ATTTATTTCA TCATCGCCCC GTTAACTAGC TTTGAAGTCT 600 

30 

TTAGCACACT TGCATATACC GGCTGTCGTG CTGGCkAGAT ACTAGCATTG AAGTGGTCTG 660 

ATATTGATTT TGAAAACAAC ACGATTAGTA TTACTAAAAC ATATTACAAT CCAAATAATA 720 

35 ACAAGAAGAA ATATCAGATA CTTCCCCCTA AAACTGAAAG TTCTATCGGT AAGATTTCCG 780 

TTGACCCAAA TGTAATAAAG GtGtTGCGtG ATTATAAGAT AAACGTTCAA AATAATTGGA 840 

AAAACGAATT ATATAATGAT AACCATTGTA ATGAAAAAAC TATCAATGTG GATACAAACC 900 

40 

ATTATGTCAC GTACCAGCAT ACTCAAA 927 
(2) INFORMATION FOR SEQ ID NO: 675: 

(i) SEQUENCE CHARACTERISTICS: 

6 (A) LENGTH: 1100 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 



so 



55 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 675: 
GATGTTAAnA TAAGTACATC ATTTTGACTC CCAAATATTG GCTTTAGACC TTGAAATGCT 60 
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CTCATAATGG CATCAGGTAC cAGGGGTTGG GaCCAGGTGT TAATAACAAC GGTTGATGAT 180 

AATACATTTA TATGCCTCCT ATAAATAAGA TTTCACTATT TTAGCAAATT TTCTGAAAAT 240 

5 

TTAAAAGCCT AAAAAgtGAT AACGCTATAT TGTCGAACAA ACGTTATCAC TTAACGATTT 300 

TATTTGGCCT GAATGATGGG ATAGATTTTT ATGTCCACAT TATTTCTTAC AGCATTTGAA 360 

ATCATGCAAT TATTATCTGC AATTGTTATC AATTTTGGTA ATCGCTTTTC TAATTGTGCT 420 

10 

ATTTGATCAC TTGGAATTTG AATTTGAGGA TGGTGCACAA TTTTTGACAT ACTGAATTTT 480 

CCGTTATTTA AACAAGCTGT TCCAATCGAT TGTTGTkCAA TTGAAATATC TGTGAACTTT 540 

15 GCACGTTCAA GAGTAGCTGC TAATGAGATG ATATAACATG ATGAAGCGGC TGATACTAAC €00 

ATTTCATCGG GATTTGTTCC TATACCAACA CCACCTAAAG AAGCAGGTAT AGAAATATTC 660 

TCTGAAAGTA TGTCGCCTTG AACGTTTCCG ACATTGTTAC GACCACCTTG CCAAGAAGTT 720 

20 TGGACTTTAA AGTCATGTTG ATGCAATTGC TTTAACCTCC AATATAATTG TGATAGTTTA 780 

ATTTTAGAAT AGTTTATCAA AGTTTAACAG AAAGGTGACT TATCAATGAC TCTGAATAAA 840 

CTGAAAGATG AATTACAAAT TGTTTCGCAC CGTGGATTGC CGAGTGATTT TCCTGAAAAT 900- 

25 

ACAATGGTCG GTTATCGAGA GGTAATGGGG CTCAATGTTG CTATGTTAGA AATAGATGTT 960 

CATTTGACCA AAGACCAACA TTTTGTTGTG ATACATGaTG AAACAATTGa TAGAACATCG 1020 

GaTGGtArGG GGCGTAwTGc TGaTTACACA TTATCGCAAT TAAAATCATT TGATTTTGGT 1080 

30 

AGTTATAAAG ATGTTGCTTT 1100 
(2) INFORMATION FOR SEQ ID NO: 676: 

35 (i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH : 460 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 

40 

ixi) SEQUENCE DESCRIPTION: SEQ ID NO: 676: 
ATTAATTTCA TATGGAAATA GTTGAACTAA CTGCGCTGTA TAAGCTTCAA CAGTTTGATG 60 

45 

AATTAACGAT TGATCTTCAA TATATCCGTA GAACAAATCT TCAGTACAAA CTACTTTACC 120 
TTTATCAGGT TTAATTGCAC CTGCCAACAA TTGACCTACC AACGCTTTGG AAGATTCAGG 160 
TTCACCAATT ATACCTAATG CTTCTCCTTG ATAAATATGT AAACTAATAT TGTTTAAATC 240 

SO 

GATATCTTCA GCATCATATC CAAAAGGTAA ATACCATTTC TTATTCTGTT TATTCCTATA 300. 
GTAGTGTGTT ACTTTTAGTA ACTTTAAAAC AATTGAACTT CCCATCTATT TTCATCCTTC 360 

55 
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CCCCACGCaA AAATACCTTT TAATCTTnCT ACTTTAAAAT 
(2) INFORMATION FOR SEQ ID NO: 677: 

5 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 1451 base pairs 

(B) TYPE: nucleic acid 
<C) STRANDEDNESS : double 
(D) TOPOLOGY: linear 

10 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 677: 



1S 


GTCAAGTTTT CGGCTAGATT TTAAACGCTC 


ATCACTATGT 


AGAATGAAAC 


TTTCGAAAAA 


60 




CTGTAAATCA TCATAACCTT TTACATAAAC 


ATAACCTTCG 


CCACCAATTG 


CTTGAATTAA 


120 




ACATTGGGCG GCCATTTGAA TTTCTAAAGA 


TTGTTTTTCT AGCCTATTAA AGATACCTAT 


180 


20 


TAGTTGTGTG TTTAAGATTT TTGACATCTT 


TATCCTCCAA 


TCTACTTATA 


AAATATTGTA 


240 




ATTAATGACT ACATATTATG CAACGGCTTA 


AATTGTATAA AAATGTATAC 


GTTTGCATTT 


300 


25 


AGTATAACTA TCGCATTTTT CAAAAAATAC 


ACATTTAATC 


TGCAGTATTT 


CAATGCATTG 


360 


ACGCTATTTT TTTGATATAA TTACTTTGAA 


AAATACGTGC 


GTAAGCACTC 


AAGGAGGAAC 


420 




TTTCATGCCT TTAGTTTCAA TGAAAGAAAT 


GTTAATTGAT 


GCAAAAGAAA 


ATGGTTATGC 


480 


30 


GGTAGGTCAA TACAATATTA ATAACCTAGA 


ATTCACTCAA 


GCAATTTTAG 


AAGCGTCACA 


540 




AGAAGAAAAT GCACCTGTAA TTTTAGGTGT 


TTCTGAAGGT 


GCTGCTCGTT 


ACATGAGCGG 


600 




TTTCTACACA . ATTGTTAAAA TGGTTGAAGG 


GTTAATGCAT 


GACTTAAACA 


TCACTATTCC 


660 


35 


TGTAGCAATC CATTTAGACC ATGGTTCAAG 


CTTTGAAAAA 


TGTAAAGAAG 


CTATCGATGC 


720 




TGGTTTCACA TCAGTAATGA TCGATGCTTC 


ACACAGCCCA 


TTCGAAGAAA 


ACGTAGCAAC 


780 




AACTAAAAAA GTTGTTGAAT ACGCTCATGA 


AAAAGGTGTT 


TCTGTAGAAG 


CTGAATTAGG 


840 


40 


TACTGTTGGT GGACaAGAAG ATGATGTTGT 


AGCAGACGGC 


ATCATTTATG 


CTGATCCTAA 


900 




AGAATGTCAA GAACTAGTTG AAAAAACTGG 


TATTGaTGCA 


TTAGCGCCAc 


ATtAGGTTCA 


960 


45 


GTTCATGGTC CATACAAAGG TGAACCAAAA 


TTAGGATTTA 


AAGAAATGGA 


AGAAATCGGT 


1020 


TTATCTACAG GTTTACCATT AGTATTACAC 


GGTGGTACTG 


GTATCCCGAC 


TAAAGATATC 


1080 




CAAAAAGCAA TTCCATTTGG TACAGCTAAA 


ATTAACGTAA 


ACACTGAAAA 


CCAAATCGCT 


1140 


50 


TCAgCAAAAG CAGTTCGTGA CGTTTTAAAT 


AACGACAAAG 


AAGTTTACGA 


TCCTCGTAAA 


1200 




TACTTAGGAC CTGCACGTGa AGCCATCAAA 


GAAACmGTTA 


AAGGtAAAAT 


TAAAGAGTTC 


1260 




GGTACTTCTA ACCGCGCTAA ATAATTAATA 


TTTAGTCTTT 


AAGTTATTAA 


TAACGTAGGG 


1320 



55 
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AATAAATAAA ACAGTTTGAT TTTAAAATGA AAGCGTAAAA ATGGTAAAAT ATATCAAAAT 1440 
TGATTGTGAT A 1451 
£ - (2) INFORMATION FOR SEQ ID NO: 678: 

(i) SEQUENCE CHARACTERISTICS; 

(A) LENGTH: 668 base pairs 

(B) TYPE: nucleic acid 

10 (C) STRANDEDNESS : double 

(D) TOPOLOGY: linear 



<xi) SEQUENCE DESCRIPTION: SEQ ID NO: 678: 





nGTATTGAAG 


CGGTTAAACA 


AACACCTAAT 


GCAACTGACG 


AAGAAAAGCA 


GGCTGCTGTT 


60 




AATCAAATCA 


ATCAACTTAA 


AGATCAAGCA 


ATTAATCAAA 


TTAATCAAAA 


CCAAACAAAT 


120 


20 


GATCAGGTAG 


ACACAACTAC 


AAATCAAGCG 


GTAAATGCTA 


TAGATAATGT 


TGAAGCTGAA 


180 




GTAGTAATTA 


AAACAAAGGC 


AATTGCAGAT 


ATTGAAAAAG 


CTGTTAAAGA 


AAAGCAACAG 


24 0 




CAAATTGATA 


ATAGTCTTGA 


TTCAACAGAT 


AATGAGAAAG 


AAGTTGCTTC 


ACAAGCATTA 


300 


25 


GCTAAAGAAA 


AAGAAAAAGC 


ACTTGCAGCT 


ATTGACCAAG 


CTCAAACGAA 


TAGTCAGGTG 


360 




AATCAAGCAG 


CAACAAATGG 


TGTATCAGCG 


ATTAAAATTA 


TTCAACCTGA 


AACAAAAGTT 


420 


30 


AAACCAGCTG 


CACGTGAAAA 


AATcAATCAA 


AAAGCGAATG 


AATTACGTGc 


TAAGATTAAT 


480 


CAGGATAAAG 


AAGCAACAGC 


AGAAGAAAGA 


CAAGTAGCAC 


TAGATAAAAT 


CAATGAATTT 


54 0 




GTAAATCAAG 


CCATGACAGA 


TATTACGAAT 


AATAGAACAA 


ATCAACAAGT 


TGATGATACA 


600 


35 


ACAgTCAgCG 


CTgATAGCtT 


GCTTTAGTGA 


CGCCTGACCA TATTGTTAGA GCgCTGCTAG 


660 




AGATGCGT 












668 



(2) INFORMATION FOR SEQ ID NO: 67 9: 

40 (i) SEQUENCE CHARACTERISTICS : 

(A) LENGTH: 1906 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 

(D) TOPOLOGY: linear 

45 

(Xi) SEQUENCE DESCRIPTION: SEQ ID NO: 679: 
GATCCAAATT TAAAAGGAAA AATAGCCTTV AACGAATTTA CGAAACAAAT TGAATGTTTA 60 

50 

GGGAAAGTGC CATGGAATAC TAATTTTAAG ACACGTCAAT GGCAAGACGG TGATGATAGC 120 
AGTTTAAGAA GTTATATCGA AAAGATTTAT GACATACACC ATTCAGGTAA AACAAAAGAT 180 



1598 
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ATCGTGGGAT 


GGACATAAAC 


GCCTTGAAAA 


GTTATTTATC 


AAATACTTAG 


GTGTTGAAGA 


300 




CcTGaAGTGA 


ATAGAACAAC 


TACCAAAAAA 


GCATTGACTG 


CTGGAATCGC 


TAGAGTAATG 


360 


5 


GAGCCTGGAT 


GTAAATTTGA 


CTATATGCTT 


ACACTTTATG 


GTCCTCAAGG 


TGTAGGTAAA 


420 




TCTGCTTTGC 


TAAAAAAATT 


AGGTGGTGCA 


TGGTTTTCTG 


ACAGTTTAGT 


TTCTGTTACA 


480 




GGTAAAGAAG 


CTTATGAGGC 


CTTACAAGGC 


GTTTGGCTAA 


TGGAAATGGC 


AGAACTTGCA 


540 


10 


GCTACAAGAA 


AAGCTGAAGT 


TGAAGCTATT 


AAGCATTTCA 


TATCTAAACA 


AGTTGACCGA 


600 




TTTCGTGTTG 


CTTATGGGCA 


TTATATTGAA 


GATTTTCCAA 


GGCAATGTAT 


TTTCATTGGT 


660 


15 


ACAACTAATA 


AAGTTGATTT 


CTTAAGAGAT 


GAAACTGGTG 


GAAGACGTTT 


TTGGCCAATG 


720 


ACTGTAAATC 


CAGAGAGAGT 


TGAAGTGAAC 


TGGTCTAAAC 


TAACCAAAGA 


TGAGATTGAC 


780 




CAAATTTGGG 


CAGAAGCTAA 


ACACTATTAT 


GAACAAGGAG 


AAGATTTATT 


CCTTAACCCT 


840 


20 


GAACTAGAAG 


AAGAAATGCG 


TTCAATACAA 


AGCAAACATA 


CTGAGGAATC 


TCCATATACA 


900 




GGCATTATTG 


ATGAATATCT 


TAACACACCm 


ATTCCtAGCa 


ATTGGGATGA 


CTTAACTATC 


960 




TTTGAACGAA 


GACGATTTTA 


TCaAGGTGAT 


GTTGATATGT 


TACCaACAGG 


AAATGTaGAT 


1020 


25 


TACGTTAAAA 


GAAATAAAGT 


CTGTGCGCTT 


GAAGTGTTTG 


TTGAATGTTT 


TGGTAAAGAT 


1080 




AAGGGAGATA 


GTAGAGGATC 


TATGGAAATT 


AGAAAGATTT 


CAAACATCTT 


AAGACAATTA 


1140 




GACAATTGGT 


CTGTATATGA 


TGGTAATAAA 


AGTGGGAAAA 


TTCGATTTGG 


AAAAGATTAT 


1200 


30 


GGTGTACAGA 


TAGCTTATGT 


AAGAGATGAA 


AGTTTAGAGG 


ATTTAATATA 


AGAAATATTG 


1260 




AATAAATATG 


CATTTTAGAG 


TGTTGTATCA 


GATGTTGCAT 


CATTTTTTGA 


GTGATGCAAC 


1320 


35 


ACGGGAGTGT 


AAAAAGTAAT 


CGTAGGTGTT 


GTATCATTTT 


TGGTGATGCA ACATTGATGC 


1380 


AACAAATGAT 


ACAACACCTC 


TTTCCTTTCT 


AGCTGTAGGG 


TTCAACCCTG 


TTTGTTTCCA 


1440 




ATGTTGCATC 


AAATTCACTA 


TAAAGTTTAA 


AAAGTAGTGT 


TAGGGAGTAA 


AGGGGTATAG 


1500 


40 


GGGTAACCCT 


CTAACAGCTA 


TTTTTAAAAG 


TTTGGCAAGA 


ATTGATACAA 


CATCGGAACA 


1560 




CAAATATAAA 


TTTTGTATAC 


AAGGTGAATA 


AATGAAAGAA 


TCGACATTAG 


AAAAATATTT 


1620 




AGTGAAAGAG 


ATAACAAAGC 


TAAACGGTTT 


ATGTTTAAAA 


TGGGTCGCAC 


CTGGAACAAG 


1680 


45 


AGGTGTGCCA 


GATAGAATTA 


TTATTATGCC 


AGAAGGAAAA 


ACATATTTTG 


TAGAAATGAA 


1740 




GCAAGAAAAA 


GGAAAGTTGC 


ATCCTTTACA 


ArAATATGTG 


CATAGACAAT 


TTGAAAATAG 


1800 




AGaTCATAAA 


GTATATGTGT 


TA7GGAATAA 


AGAACAAGTA 


AATACTTTTA 


TCAGAwTGGT 


I860 


50 


AGTGAACATT 


TGGCGATTGA 


CTTTCAAACC 


ACATAGCTnT 


CCAAAG 




1906 



(2) INFORMATION FOR SEQ ID NO: 680: 

55 . 
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(A) LENGTH: 94 8 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : double 

(D) TOPOLOGY : linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 680: 



10 


AATTATTTGA 


ATAAATTAGC 


AATTAAAGAG 


TTGATTTGTC AGTTTAAGyA TTTGAGTGCA 


60 




TTTGAAAAAG 


ATGTCATGTA 


TTTAATGTGT 


GAACAATATA 


AGCCGAGAGA 


AATTGCTCAA 


120 




TTGATGCATG 


TAAAAGAGAA 


AGTGATTTAT 


AATGCCATAC 


AACGATGTrA 


AAATAAAATA 


1B0 


15 


AAACGTTATT 


TCAAAATGAT 


TTGAAAAGCG 


CCTTAGGACG 


TGAATTGAAT 


TATAACGTGT 


240 




TACTTACTGA 


TGGTTTGACA 


TTTGTTATAA 


ATTTTATGTA 


TAGTATACTG 


GTATTATAAT 


300 


20 


GAATAAAGGT 


GAATTATTGT 


GAG AAAAATA 


CCTTTAAATT 


GTGAAGCTTG 


TGGCAATAGA 


360 


AATTATAATG 






GCAACAAGAT 


TAACCTTAAA 


GAAATATTGT 


420 




CCAAAATGTA 


ACGCGCACAC 


AATTCATAAA 


GAATCGAAAT 


AAATACATTC 


GAAATAATAC 


480 


25 


TTTGATAATA 


TGTTCAAAGG 


ATTTGGAGGT 


TGAGCAGATG 


GCTAAAAAAG 


AAAGTTTCTT 


54 0 




TAAAGGCGTT 


AAGTCTGAAA 


TGGAAAAAAC 


AAGTTGGCCG 


ACGAAAGAAG 


AGCTATTTAA 


600 




ATATACTGTA 


ATTGTAGTTT 


CTACTGTTAT 


ATTCTTCTTA 


GTCTTTTTCT 


ATGCCTTAGA 


660 


30 


TTTAGGAATT 


ACAGCATTGA 


AAAATTTATT 


ATTTGGTTAG 


AGGAGTGAAG 


ACATGTCTGA 


720 




AGAAGTTGGC 


GCAAAGCtTG 


GTATGCAGTG 


CATACATATT 


CTGGATATGA 


AAATAAAGTT 


780 




AAAAAGAATT 


TAGAAAAAAG 


AGTAGAATCT 


ATGaATATGA 


CTGAACAAAT 


CTTTAGAGTA 


840 


35 


GTCATACCGG 


AAGGAAGAAG 


GAAACCTCCA 


GTAAnAAGnT 


GGCCAAGCCT 


AAAACCGCCT 


900 




GTTAAAAAAA 


ACCATTCCCC 


TGGGnTAnGG 


TTTTAAGTGG 


GAATTTAA 




94 8 



(2) INFORMATION FOR SEQ ID NO: 681: 

40 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 863 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: double 
<D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 681: 
50 ACAnATAATA ACAAAGCGCT TGCTAGTACC TCTTAAAAAG ATGATGCTAG CAAGCGCTTk 60 

TCTATACTAT ATATTATTTT TCTAAAATTT TAACACCCTC TTGAGTGCCT ACAATAACTT 120 
GATCTGCCAT ATCTAAGAAG TATCCTGTCT CAAACACACC TGTCAGATGA ATTAAATACT 180 

55 



1600 



